COMPTOIR
register

Et le premier processeur pour serveur en 10nm est un... ARM

Signe des temps ou changement de paradigme ? Après avoir devancé tout le monde concernant la finesse de gravure des CPUs pour mobiles, Qualcomm s’en va chasser sur les terres d’Intel avec le premier processeur dédié aux serveurs et datacenters gravé en 10nm FinFET. Car avec une part de marché qui se situe au-delà des 90 %, autant dire qu’Intel est vraiment le boss au royaume des serveurs, mais Qualcomm espère bien s’attribuer une part du gâteau. Le 3e fabricant de semi-conducteurs mondial (derrière Intel et Samsung) mise pour cela sur l’influence grandissante de l’Open Source dans le secteur et sur la volonté des géants tels qu'Amazon ou Google de s'émanciper du joug d'Intel.

Basé sur une architecture maison nommée Falkor, le Centriq 2400 embarque jusqu’à 48 coeurs ARMv8. Il s’agit là de la plus grosse puce de Qualcomm à ce jour. La société, qui a fait la démonstration de son petit dernier en montrant ses capacités de traitement Big Data (une pile Linux/Java/Hadoop), mais sans dévoiler de benchmarks, est encore avare en détail : le fondeur (même s’il ne peut s’agir que de Samsung ou de TSMC), ainsi que les fréquences de fonctionnement, le TDP ou la quantité de cache embarqué n’ont pour le moment pas été dévoilés.

Au final, on ne sait donc pas grand-chose. Qualcomm assure pourtant que son processeur sera compétitif tant au niveau de la consommation électrique qu’au niveau de la puissance de calcul. Si l’on a peu de doutes sur le côté consommation, faire jeu égal avec Intel au niveau puissance risque de se montrer plus difficile. Et quand bien même, réussir là où SGI, SUN, IBM ont échoué, au moment même où Broadcom lâche l'affaire et qu'AMD met en sommeil ses plans ARM pour serveurs afin de tenter le coup avec Zen, cela reste un sacré défi.

 

qualcomm centriq 2400

Un poil avant ?

La route d'ADATA vers la 3D NAND se poursuit

Un peu plus tard ...

VEGA 10 en démo dans la carte spécialisée Deep Learning MI25

Les 22 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Un ragoteur charitable de Lorraine, le Samedi 17 Décembre 2016 à 01h19  
par Un ragoteur dingo BZH de Bretagne, le Vendredi 16 Décembre 2016 à 07h26
Salut le Mignon Le problème d'un CPU monocore est qu'il calcul plus vite, mais avec une plus grande latence. Hors la latence est un goulet d'étranglement pour les applications multi-utilisateurs qui exigent un temps de réponse ultra-rapide. C'est pourquoi les serveurs apprécient particulièrement les CPU massivement parallèle. CQFD.
Le problème d'un CPU OoO, c'est qu'il envoie plus d'instructions en un nombre de cycles donné, mais la fin d'une série n'arrive pas forcément plus vite...

On peut encore en trouver d'autres je pense, surtout que tu oublies le détail qui tue... un serveur, il a une interface unique avec tous ses clients au moins à un niveau. Si on part du principe que le serveur va exécuter certaines routines systématiquement, il peut être judicieux d'en faire des paquets pour les envoyer à des unités d'exécution massivement parallèles (Cf. GCN et les archis NVidia depuis Fermi), partant de là, c'est l'architecture elle-même qu'il faudrait revoir.

Evidemment, ça n'est pas applicable à tout, un pauvre serveur applicatif ou web ne reçoit pas assez de requêtes pour profiter de ce type d'architecture, à l'inverse de serveurs de jeu (connexion permanente) ou de streaming (nombre de flux diffusés pouvant être élevé )
par Un ragoteur dingo BZH de Bretagne, le Vendredi 16 Décembre 2016 à 07h26  
par Un ragoteur tout mignon de Rhone-Alpes, le Mardi 13 Décembre 2016 à 18h07
C'est bien ce que j'ai compris néanmoins je tenais à souligner le fait que la multiplication des coeurs n'était probablement pas la solution pour faire évoluer les performances d'un processeur hors application serveur.
Salut le Mignon Le problème d'un CPU monocore est qu'il calcul plus vite, mais avec une plus grande latence. Hors la latence est un goulet d'étranglement pour les applications multi-utilisateurs qui exigent un temps de réponse ultra-rapide. C'est pourquoi les serveurs apprécient particulièrement les CPU massivement parallèle. CQFD.
par Un ragoteur charitable de Lorraine, le Mercredi 14 Décembre 2016 à 16h08  
par Un ragoteur dingo BZH de Bretagne, le Mardi 13 Décembre 2016 à 06h34
Vous n'avez peut-être pas bien lu, mais ce processeur n'est pas fait pour les calculateurs, mais pour les serveurs. Ces derniers se contentent le plus souvent de transférer des données pour de nombreux utilisateurs. C'est donc une application massivement parallèle, comme par exemple gérer les connexions des joueurs online. Un CPU ne sert pas qu'à calculer.
Le petit problème, c'est que pour le massivement parallèle on a déjà des GPU... actuellement ils restent cantonnés au rôle de co-processeurs, mais il serait absurde de ne pas étudier la "fusion" CPU/GPU à court terme, cette même fusion qu'AMD traîne à réaliser.
par Un ragoteur 'ArthaX' du Centre, le Mardi 13 Décembre 2016 à 23h37  
J'ai discuté un peu avec mes collègues sur la possibilité d'avoir des Qualcomm Centriq dans nos futurs serveurs ARM.
La réponse est non, car nos serveurs ARM sont des micro-serveurs et se doivent d'être sous les 5W de consommation, et sous les 3,5W en moyenne.
On aura des Cortex-A57 ou A72 de préférence avec quatre coeurs. Et la puissance doit pouvoir faire jeu égal à un Core 2 Duo @1GHz.
Nous avons déjà des serveurs avec des Cortex-A15 et Cortex-A53, et les clients sont très contents et ils sont tous loués avant même que nous les produisons.
@++
par Sebastien G., le Mardi 13 Décembre 2016 à 22h59  
par Un rat goth à l'heure de Rhone-Alpes, le Mardi 13 Décembre 2016 à 22h32
Certes mais cela revient au même de dire que la capacité de calcul d'un seul coeur limite l'exécution d'un programme qui n'est pas 100 % parallélisable en pratique hors application serveur.
Oui, cela signifie que la partie non parallélisable ne s'exécutera pas plus vite que la puissance d'un seul cœur ne le lui permet.Après ici, il n'est pas question d'autres tâches que de tâches "serveurs", massivement parallèles, ce n'est pas un processeur grand public.
par Un rat goth à l'heure de Rhone-Alpes, le Mardi 13 Décembre 2016 à 22h32  
par Sebastien G., le Mardi 13 Décembre 2016 à 22h19
Ce n'est pas exactement ce que dit la loi d'Amdahl. Elle dit que le gain en performance est limité par la partie sérielle (non parallélisable) d'un programme.
Certes mais cela revient au même de dire que la capacité de calcul d'un seul coeur limite l'exécution d'un programme qui n'est pas 100 % parallélisable en pratique hors application serveur.
par Un rat goth à l'heure de Rhone-Alpes, le Mardi 13 Décembre 2016 à 22h27  
par Scrabble, le Mardi 13 Décembre 2016 à 20h59
Si, c'est forcément la solution étant donné qu'il n'y en a aucune autre.
Comme Marine LEPEN mais je persiste à croire que c'est une fausse bonne idée.
par Sebastien G., le Mardi 13 Décembre 2016 à 22h19  
par Un ragoteur qui aime les de Rhone-Alpes, le Mardi 13 Décembre 2016 à 02h45
Aucun intérêt pour des programmes massivement linéaires sur la machine d'un particulier. Et même sur un serveur il faudra un certain nombre de thread|processus pour occuper 48 coeurs en permanence. Le multicore ça fait peut être jolie sur une brochure commerciale néanmoins la performance reste limitée à la puissance de calcul d'un simple coeur selon la loi d'Amdahl.
Ce n'est pas exactement ce que dit la loi d'Amdahl. Elle dit que le gain en performance est limité par la partie sérielle (non parallélisable) d'un programme.
par Sebastien G., le Mardi 13 Décembre 2016 à 22h08  
par Un ragoteur de transit d'Ile-de-France, le Mardi 13 Décembre 2016 à 21h05
Vous dites qu'IBM a lâché l'affaire mais les Power 8 ont été pensé pour les serveurs non ?
IBM n'a pas lâché l'affaire, Il a échoué à prendre des parts de marché à Intel.
par Un ragoteur de transit d'Ile-de-France, le Mardi 13 Décembre 2016 à 21h05  
Vous dites qu'IBM a lâché l'affaire mais les Power 8 ont été pensé pour les serveurs non ?
par Scrabble, le Mardi 13 Décembre 2016 à 20h59  
par Un ragoteur tout mignon de Rhone-Alpes, le Mardi 13 Décembre 2016 à 18h07
C'est bien ce que j'ai compris néanmoins je tenais à souligner le fait que la multiplication des coeurs n'était probablement pas la solution pour faire évoluer les performances d'un processeur hors application serveur.
Si, c'est forcément la solution étant donné qu'il n'y en a aucune autre.
par Un ragoteur tout mignon de Rhone-Alpes, le Mardi 13 Décembre 2016 à 18h07  
par Un ragoteur dingo BZH de Bretagne, le Mardi 13 Décembre 2016 à 06h34
Vous n'avez peut-être pas bien lu, mais ce processeur n'est pas fait pour les calculateurs, mais pour les serveurs. Ces derniers se contentent le plus souvent de transférer des données pour de nombreux utilisateurs. C'est donc une application massivement parallèle, comme par exemple gérer les connexions des joueurs online. Un CPU ne sert pas qu'à calculer.
C'est bien ce que j'ai compris néanmoins je tenais à souligner le fait que la multiplication des coeurs n'était probablement pas la solution pour faire évoluer les performances d'un processeur hors application serveur.