COMPTOIR
  
register

Des bons gros CPU pour serveurs chez arm : les N1 et E1

Hasard du calendrier, la sortie de nouveaux design ARM coïncide à quelques jours près avec celle d'un projet d'émulation des binaires x86 sur Linux ARM. Linux qui est, rappelons-le, le principal OS sur ce segment. En effet, les Anglais concepteur de SoC efficients énergétiquement ont dévoilé hier deux plateformes dédiées à ces usages : les Neoverse N1 et E1.

 

amd server 2019 slide

L'offre sur le segment serveur d'ARM s'est considérablement élargie ces derniers temps

 

Les N1 sont architecturés autour d'un CPU du même nom comportant une structure proche du Cortex A-76 dévoilé en 2018 : 7 nm, jeu d'instructions 64-bit ARMv8.2-A, 64 ko de cache L1D et L1I ainsi que 512 à 1024 ko de L2, tous deux pouvant contenir des données supportant la correction d'erreur. Côté ressource matérielle, on a droit à trois unités de calcul entier, deux unités SIMD 128-bit accompagnées de leurs confrères de chargement-rangement, le tout imbriqué dans un pipeline Out-of-Order de 11 étages. Un changement majeur par rapport à la version grand public réside dans la topologie d'organisation des caches en mesh via le CMN-600 Coherent Mesh Network qui n'est pas sans rappeler la solution proposée par Intel sur sa Scalable Platform. Notez que, comme à l'accoutumée avec ARM, la partie CPU est très réduite : sur la version à 512 ko de L2, il est question d'une surface de 1,2 mm² seulement, pas mal pour les coûts de production.

Bien que la gamme exacte de CPU n'ait pas été dévoilée, il a été question de modèles à 64 cœurs pour des fréquences allant de 2,6 à 3,1 GHz, le tout dans une enveloppe thermique de 105 W : en route vers la haute performance !

 

Le Neoverse E1 est plus timide : avec des caches L1 pouvant être de 32 ou 64 ko, un L2 facultatif entre 64 et 512 ko (toujours avec ECC), ce CPU est issu du Cortex-A65AE, un design conçu pour l'automobile autonome. Mais la grande nouveauté réside l'apparition du SMT à 2 voies, c'est à dire le dédoublement de certains composants pour faire mouliner deux cœurs logiques sur un cœur physique dans le but de continuer à exploiter les ressources de calcul du thread jumeau quand le premier est dans l'attente d'une donnée provenant de la mémoire. Issue d'un pipeline Out-of-Order à 10 étages, ce E1 se compare plutôt aux Cortex-A55, et est calibré pour une fréquence proche de 2,5 GHz tout en étant prévu pour être embarqué dans un design de référence à 32 cœurs. La cible est cette fois des serveurs relais orientés transmissions de données avec la 5G en ligne de mire : on reste quelque part liée à l'informatique embarquée ! (Source : WikiChip et AnandTech)

 

windows 10 arm logo

Windows ? En voilà une drôle d'idée pour ces cœurs next-gen !

Un poil avant ?

Les films sur Steam, c'est fini !

Un peu plus tard ...

Denuvo 5.6 de Metro Exodus et l'UWP de Crackdown 3 sont déjà tombés

Les 10 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Un ragoteur à cpu en Île-de-France, le Vendredi 22 Février 2019 à 09h48  
Quand il s'agit d'avoir les meilleurs perfs pour la consommation la + basse oui les ARM custom (Apple, Qualcomm, HiSilicon, .....) valent largement et même dépassent des Intel Mobile sous cadencés pour tenir l'objectif de conso, mais en performance pure l'architecture x86-64 d'Intel ou AMD sera toujours largement devant.

Tout simplement parce que les cpu x86 sont conçu à la base pour de la performance pure (objectif conso en 2nde position), et les cpu ARM pour la consommation la + basse possible (objectif perf en 2nde position).

En gros comparer x86 et ARM c'est comme comparer pomme et orange. Les 1ers sont tout deux des cpu, les 2nd tout deux des fruits, mais ils ne se destinent tous à ne pas être consommé de la même façon.
par Un ragoteur macagneur en Provence-Alpes-Côte d'Azur, le Vendredi 22 Février 2019 à 08h10  
par Jemporte, le Vendredi 22 Février 2019 à 00h07
Pour info l'Arm A12X de l'Ipad Pro, un 8 cores non multithreadé, fait quasi jeu égal avec l'Intel mobile 6 cores 12 threads ultime en mono et multicores. Avec les progrès d'Apple sur ARM à chaque génération, il est difficile de croire que l'architecture x86 résistera encore plus de 2 ans sur la gamme complète à moins d'accepter d'avoir un Mac aux performances inférieures à son iPad et iphone... d'autant plus que s'il y a 8 cores sur un iPad, un Mac pourrait en recevoir 16 plus rapides, facilement. Plus petits, moins chers à produire, désormais bientôt plus rapides, consommant moins et capables de profiter d'une gravure plus en pointe, émulant facilement le x86 32 bits... aucune raison de garder des CPU x86 sur Mac.
J'ajouterai que M$ est en train de s'y mettre aussi. Comme d'habitude, ils regardent Apple réussir pour essayer de copier à leur sauce. Ca leur a pas trop réussi dernièrement, à copier aussi l'écosystème fermé avec...
Ouais, enfin c'est aussi rapide sur un bench (geekbench) qui est très favorable aux architecture ARM, testant pas mal de chiffrement, et autres algorithme ayant une accélération matériel sur ARM. Mais dès qu'il s'agit d'algorithmes plus généraux, x86 repasse devant.

Et puis de toute façon de n'est pas le but, le x86 fonctionne extrêmement bien. Le but du ARM est d'avoir des performances correctes pour des tâches communes tout en consommant un minimum, d'où l'utilisation d'accélération matériel, et ça marche extrêmement bien. Enfin si tu te limite à du web et du multimédia...
par Hornpipe, le Vendredi 22 Février 2019 à 06h49  
par Un ragoteur des lumière de Bretagne, le Vendredi 22 Février 2019 à 04h24
jeanporte, il faut arrêter maintenant
ça suffit toutes tes inepties
Les commentaires placés sous un article sont une zone de débat. Tout le monde a le droit de donner un avis, si tant est qu'il soit argumenté. Jemporte dit peut être des inepties, mais il argumente. Toi, non.

Si tu n'es pas d'accord avec lui et qu'il dit effectivement des inepties (personnellement, je n'en sais rien, et je n'ai même pas lu tout ce qu'il a écrit parce que le sujet ne m'intéresse pas trop), alors il te revient de démonter ses affirmations une à une en apportant la démonstration qu'il a tort. Je pense que c'est la moindre des choses.

Il serait temps que les attitudes de piliers de comptoir quittent un peu nos concitoyens. C'est fatigant de voir tout le monde geindre pour imposer sa propre vision, sans même avoir la décence d'adopter une position objective et une attitude constructive.
par Un ragoteur des lumière de Bretagne, le Vendredi 22 Février 2019 à 04h24  
jeanporte, il faut arrêter maintenant
ça suffit toutes tes inepties
par Jemporte, le Vendredi 22 Février 2019 à 00h07  
par Nicolas D., le Jeudi 21 Février 2019 à 23h03
Attention à ne pas lire de traviole, le 64 cœurs n'a pas le SMT, c'est le 32 qui en est pourvu .
Effectivement.
Celà dit, avec Meltdown et Spectre qui frappent aussi des architectures ARM similaires aux x86, c'est pas une grosse perte niveau serveurs, plutôt une qualité. Mais effectivement niveau performances, à comparer à du Epyc 32 coeurs moulinant pas trop vite. Et pour le coup la variante SMT automobile s'en fout des attaques réseau potentielles sur ses VMs .

On peut peut-être aussi penser à Apple qui est censé basculer ses modèles Mac (au moins une partie des Macbook) en ARM Maison l'année prochaine. A voir comment sera alors gérée la partie graphique. Pour info l'Arm A12X de l'Ipad Pro, un 8 cores non multithreadé, fait quasi jeu égal avec l'Intel mobile 6 cores 12 threads ultime en mono et multicores. Avec les progrès d'Apple sur ARM à chaque génération, il est difficile de croire que l'architecture x86 résistera encore plus de 2 ans sur la gamme complète à moins d'accepter d'avoir un Mac aux performances inférieures à son iPad et iphone... d'autant plus que s'il y a 8 cores sur un iPad, un Mac pourrait en recevoir 16 plus rapides, facilement. Plus petits, moins chers à produire, désormais bientôt plus rapides, consommant moins et capables de profiter d'une gravure plus en pointe, émulant facilement le x86 32 bits... aucune raison de garder des CPU x86 sur Mac.
J'ajouterai que M$ est en train de s'y mettre aussi. Comme d'habitude, ils regardent Apple réussir pour essayer de copier à leur sauce. Ca leur a pas trop réussi dernièrement, à copier aussi l'écosystème fermé avec...
par Nicolas D., le Jeudi 21 Février 2019 à 23h03  
par Jemporte, le Jeudi 21 Février 2019 à 22h31
Pour l'IPC ça dépend : voir ce que ça donne sur les ARM Apple. Ce coeur ARM possède, en plus, le SMT. A mon avis on doit être au niveau du x86 ou vraiment pas loin. Et puis le CPU Epyc 64 cores tournera pas à 4GHz+, parce que son TDP ferait un grand bond, mais plutôt au sweet spot à 3Ghz ou moins.
Attention à ne pas lire de traviole, le 64 cœurs n'a pas le SMT, c'est le 32 qui en est pourvu .
par Jemporte, le Jeudi 21 Février 2019 à 22h31  
par willow57, le Jeudi 21 Février 2019 à 21h23
64 coeurs avec un tdp de 105W, on doit être très loin en terme de perf d'un epic, l'ipc d'un arm n'étant pas meilleur que celui d'un x86. Ces serveurs arm, c'est surtout pour des économies d'énergie, pas de la haute performance.
Pour l'IPC ça dépend : voir ce que ça donne sur les ARM Apple. Ce coeur ARM possède, en plus, le SMT. A mon avis on doit être au niveau du x86 ou vraiment pas loin. Et puis le CPU Epyc 64 cores tournera pas à 4GHz+, parce que son TDP ferait un grand bond, mais plutôt au sweet spot à 3Ghz ou moins.
par Un ragoteur bio en Nouvelle-Aquitaine, le Jeudi 21 Février 2019 à 21h32  
Dommage que ce soit pas le N7 pour monter à bord du NormandyNormandy , et ils auraient du en sortir un qui s'appelle F1 pour aller plus vite.
par willow57, le Jeudi 21 Février 2019 à 21h23  

64 coeurs avec un tdp de 105W, on doit être très loin en terme de perf d'un epic, l'ipc d'un arm n'étant pas meilleur que celui d'un x86. Ces serveurs arm, c'est surtout pour des économies d'énergie, pas de la haute performance.
par Jemporte, le Jeudi 21 Février 2019 à 19h03  
Le 64 coeurs, 128 threads doit pas être loin d'un Epyc à base de Zen2, mais qui aura le double de TDP. Ca se défend dans des méga-serveurs avec pleins de CPU. Pour le serveur de société, la compatibilité x86 avec des performances au top, sont primordiaux par rapport à des gains TDP mineurs dans le calcul de rentabilité.