COMPTOIR
  
register

Les premiers processeurs grand public Armv9, les Cortex-X2, Cortex-A710 et Cortex-A510, sont officiels

Arm avait annoncé son renouveau avec la nouvelle architecture Armv9 en avril dernier, mais, à l’époque, un écueil de taille était présent : aucun design n’avait été annoncé, si ce n’est côté serveur, avec un Neoverse-N2, mais qui ne risquait pas de se retrouver dans nos appareils. Pourtant, ce N2 dérive bel et bien d’un design plus généraliste, et c’est bien de celui-là dont il est question aujourd’hui : le Cortex-X2, pour un maximum de performances. Pour qui chercherait des performances sans trop sacrifier l’autonomie, alors la firme met un autre modèle dans sa poche : le Cortex-A710. Enfin, Arm obligeant, ces gros out-of-order ne sont pas prévus pour être intégrés seuls dans un SoC de téléphone ou de tablette, mais sera accompagné d'autres coeurs in-order plus efficients, qui doivent assez logiquement répondre, eux aussi, aux nouvelles contraintes imposées par l'Armv9. Pour ce faire, les britanniques annoncent en parallèle le Cortex-A510, nouveau cador de cette catégorie « meilleure efficacité performance/consommation ».

 

Pour le Cortex-X2, notre cher design fait suite au Cortex-X1 de l’an dernier en reprenant une partie de son agencement logique. Tout comme les processeurs x86, les améliorations se divisent en trois catégories : front-end, back-end et sous-système mémoire. Pour le premier, les constructeurs restent taciturnes afin de ne pas trop fournir d’information à la concurrence, nous savons simplement que la prédiction de branchement a été améliorée afin de garantir un prefetch plus efficace des instructions lors des modifications du flot d’exécution des programmes ; tout en doublant le nombre d’état du prédicteur et en augmentant au passage le branch target buffer.

 

Côté back-end, le pipeline n’est pas modifié dans sa structure et garde 10 unités d’exécution ; les améliorations se cachant dans la taille de la fenêtre out-of-order (le nombre d’instructions visible à un instant donné par le processeur), qui grimpe de 224 à 288 entrées, ainsi que dans les latences des opérations, désormais toutes dans une enveloppe de 10 cycles en comptant la prédiction de branchement. Rajoutez le support SVE2, qui double la puissance brute disponible en int8 ; une aubaine pour les tâches de machine learning !

 

Enfin, la mémoire n’est pas en reste, avec une augmentation moyenne de 33 % des files de chargement/rangement, en parallèle d’un agrandissement de 20 % du TLB, prenant 48 entrées supplémentaires. Néanmoins, les bandes passantes ne changent pas avec 3 chargements et deux rangements par cycle : circulez, il n’y a rien de plus à voir !

 

arm cortex x2 archi slide

 

Le Cortex-A710 reprend les grandes lignes du Cortex-X2 tout en coupant largement là où le silicium devenait trop gourmand. Ainsi, les 10 cycles en moyenne du pipeline sont retenus, mais adaptés à la structure de l’ancien Cortex-A78 dont notre A710 est issu. De plus, l’étage de décodage a subi un sérieux régime en passant de 6 micro-instructions envoyées aux unités de calcul à 5, diminuant également la bande passant du cache concerné en conséquence. Pour contrebalancer cela, les améliorations du front-end, partagées en majorité avec le X1, réussissent à transformer cette cure d’amaigrissement en victoire du point de vue des performances — selon la maison-mère tout du moins. Rajoutez 32 ou 64 kio de L1 privé, 256 ou 512 kio de L2, toujours privé, et voilà le bousin !

 

arm cortex a710 decode slide

 

Côté A-510, nous avons à faire à un design bien plus modeste avec seulement 32 kio de L1, un L2 optionnel d’un taille maximale de 512 kio, mais surtout un pipeline d’exécution in-order (un sacrifice nécessaire pour une efficience maximale) à cinq voies : trois ALU, une unité de multiplication/accumulation et de division et une dédiée aux branchements. Pour le front-end, trois instructions peuvent être décodées en parallèle, contre 2 pour le Cortex-A55 précédent. Notez que les unités SVE2 — également compatibles NEON et calcul flottant scalaire — sont partagées entre deux cœurs (ce qui n’est pas sans rappeler la peu glorieuse époque de Bulldozer). Enfin, le sous-système mémoire tire également partie du développement du Cortex-X2 tout en l’allégeant, avec 1 chargement et un chargement ou un rangement maximum par cycle, tous deux en 128 bits.

 

arm cortex a510 cluster slide

 

Pour ce qui est de la disponibilité, nous attendons typiquement les premiers modèles équipés pour le semestre suivant, les principaux fabricants de puces Arm ayant généralement bien anticipés la pénurie et préréservés leurs créneaux de production chez Samsung/TSMC, contrairement aux GPU. Avis aux amateurs ? (Source : WikiChip)

Un poil avant ?

AMD va demander l'autorisation de racheter Xilinx à la Commission Européenne

Un peu plus tard ...

French Days • Des bons plans à la pelle ? (MàJ bis)

Les 5 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Un hardeur des ragots en Île-de-France, le Mercredi 22 Septembre 2021 à 17h54  
Si vous cherchez un Raspberry Pi haut de gamme, il y a déjà des trucs pas mal, notamment chez Khadas.
par Un ragoteur 'ArthaX' du Centre-Val de Loire, le Lundi 31 Mai 2021 à 10h50  
C'est très bon dans tous les domaines. Du haut de gamme à l'entrée de gamme.
Pour le Cortex-A510, pourrait suffire pour l'entrée et voir même le moyenne gamme. Il pourrait même équiper des ChromeBook à ~250€, il me tarde de d'en voir avec l'OS Fushia.
L'A510 pourrait même équiper les systèmes multimédia des voitures, avec des DSP en plus, ça peut même prendre en charge la conduite autonome.
Maintenant pour le Cortex-A710, ça peut même aller chercher les x86 dans les serveurs. Apple ajoute des DSP pour avoir des performances de ouf pour le rendu 3D.
Le fait de pouvoir avoir des grappes de 8 coeurs indépendants, c'est un bonne chose. Un Raspberry Pi 4 avec 4Go est déjà suffisant pour toutes les taches du quotidiennes, sauf pour une partie des jeux. Mais 8 coeurs A710, c'est plus puissant qu'une Playstation 4, après faut voir la partie graphique, mais des jeux 1080p en 60Hz, c'est de l'ordre du possible.

@++
par Nicolas D., le Samedi 29 Mai 2021 à 15h06  
par Scrabble, le Samedi 29 Mai 2021 à 11h30
Ca pourrait arriver plus vite que tu ne pense. J'ai acheté un Raspberry Pi 4 8 Go, branché une grosse carte micro SD XC dessus, un bon boitier alu pour dissiper la chaleur, et installé un Ubuntu 64, et bien c'est pas encore ça pour l'utiliser en tant que PC de bureau, mais ça n'en est plus très loin.
Si jamais il sortait un Raspberry Pi 5 avec un APU deux fois plus rapide, et pourquoi pas 16 Go de RAM, on pourrait enfin utiliser YouTube avec sérénité
Ça aura toutefois du mal à arriver, car le Pi mise sur le libre et l'accessible financièrement parlant, or un APU 2x plus puissant serait quelque chose haut de gamme de chez Qualcomm ou Mediatek ; donc cher + nouveau partenaire + pas vraiment de garantie sur l'Open Source Déjà que c'était déjà de moins en moins le cas avec le Pi 4.... Après je serai le premier heureux / client si un 5 à base de A-78 venait à sortir !
par Scrabble, le Samedi 29 Mai 2021 à 11h30  
par Un ragoteur de transit embusqué, le Samedi 29 Mai 2021 à 10h34
Hélas, cela n'est pas encore demain la veille que l'on verra des CPU ARM arriver pour des PC de bureau...
Pourtant, en poussant la puissance (et donc en faisant fi de la consommation, comme le font les CPU x86), on obtiendrait des CPU plus performants que les x86 "actuels" (si l'on ose baptiser d'actuelle une architecture des années 80 !)... Cela ferait une belle base pour un PC sous Linux.
Ca pourrait arriver plus vite que tu ne pense. J'ai acheté un Raspberry Pi 4 8 Go, branché une grosse carte micro SD XC dessus, un bon boitier alu pour dissiper la chaleur, et installé un Ubuntu 64, et bien c'est pas encore ça pour l'utiliser en tant que PC de bureau, mais ça n'en est plus très loin.
Si jamais il sortait un Raspberry Pi 5 avec un APU deux fois plus rapide, et pourquoi pas 16 Go de RAM, on pourrait enfin utiliser YouTube avec sérénité
par Un ragoteur de transit embusqué, le Samedi 29 Mai 2021 à 10h34  
Hélas, cela n'est pas encore demain la veille que l'on verra des CPU ARM arriver pour des PC de bureau...
Pourtant, en poussant la puissance (et donc en faisant fi de la consommation, comme le font les CPU x86), on obtiendrait des CPU plus performants que les x86 "actuels" (si l'on ose baptiser d'actuelle une architecture des années 80 !)... Cela ferait une belle base pour un PC sous Linux.