Face à NVIDIA, la concurrence des cartes accélératrices de Machine Learning viendrait de.... Qualcomm ?

Core Ultra 5 245K : 13 refs en stock Tendance baissière
Core i5-14600k : 8 refs en stock Tendance baissière
Core Ultra 7 265K : 14 refs en stock Tendance baissière
Core i5-14700k : 18 refs en stock Tendance haussière
Core Ultra 9 285K : 2 refs en stock Tendance stable
Tendance stable
RTX 4060 ti : 202 refs en stock Tendance haussière
Ryzen 9600X : 1 ref en stock Tendance stable
RTX 4070 SUPER : 136 refs en stock Tendance haussière
RTX 4070 TI SUPER : 105 refs en stock Tendance haussière
RTX 4080 SUPER : 52 refs en stock Tendance baissière
Ryzen 9700X : 5 refs en stock Tendance baissière
Ryzen 7 7700X : 4 refs en stock Tendance stable
Ryzen 9 7800X3D : 5 refs en stock Tendance haussière
ryzen 9800X3D : 3 refs en stock Tendance haussière
RTX 4090 : 5 refs en stock Tendance baissière
RX 7600 : 24 refs en stock Tendance haussière
RX 7700 XT : 30 refs en stock Tendance haussière
Ryzen 9 7950X3D : 4 refs en stock Tendance stable
RX 7800 XT : 28 refs en stock Tendance haussière
RX 7900 XT : 32 refs en stock Tendance haussière
PS5 Pro : 5 refs en stock Tendance stable

La réception • Actualités • Cartes graphiques

En milieu de mois, Qualcomm annonçait une puce un peu spéciale : l’AI 100 qui, comme son nom l’indique, est destinée au machine learning. Si la firme s’aventure ainsi relativement loin des SoC mobiles Snapdragon dont nous avons l’habitude, l’écart n’est pas non plus démentiel avec « seulement » 75 W de TDP maximum pour la nouvelle venue. Beaucoup, vous dites ? Pas de soucis, la maison-mère a en fait prévue trois variantes : une carte PCIe, une version en dual M.2 et une en dual M2.e, ces deux dernières allant de 15 à 25 W — sachant que la M.2e n’a pas de radiateur, son dégagement thermique pouvant ainsi être fortement bridé. Sans grande surprise, cette gamme se place parfaitement pour s’intégrer à l’edge, c’est à dire dans des serveurs à la consommation maîtrisée que l’on installe proche des infrastructures clientes (au contraire des datacenters, localisés selon un choix économique ou politique).

Des cartes presque haute performance chez Qualcomm ? [cliquer pour agrandir]

Sous le capot, le 7 nm TSMC est aux ordres, les américains profitant ainsi de leur expertise sur mobile. Au niveau architectural, le die est décomposé en 16 « AI Core » dotés chacun de 1 Mio de L2 et 8 Mio de cache TCM (amputé de moitié sur la version mobile) servant à stocker les données immobiles lors de la mise en route d’un réseau de neurones : les poids. Côté calcul, le processeur est un VLIW à 4 voies hérité des accélérateurs de ML mobiles, épaulé par un accélérateur matriciel, le tout capable de délivrer 512 MAC INT8 par cycles, ou 256 MAC/cycle en FP16. Le tout est relié à de la LPDDR4x sur un bus 256-bit (ou 128-bit pour la version embarquée), et se lie avec le système hôte en PCIe 4.0 x8.

Si rien ne semble bien novateur sur la microarchitecture — mis à part l’idée de ressortir du placard un VLIW pas vraiment resté dans les annales —, Qualcomm défend cores (hohoho) et âme son bébé et a récemment soumis plusieurs de ses cartes à la suite de benchmarks MLPerf. Mis en paquet de 4 ou de 8, les AI 100 ne sont pas encore à la hauteur de la A100 de NVIDIA, reine du genre, sur les performances ; mais du côté de l’efficacité énergétique, c’est une toute autre histoire.

Des performances encore en deça des verts [cliquer pour agrandir]

Notez que les graphes permettent également une comparaison frontale x86 vs ARM avec — de manière peu surprenante vu que c’est au GPU de bosser — peu de différence entre les deux

Pourtant, les deux cartes partagent le même procédé de gravure à savoir le 7 nm de chez TSMC mais grâce à l’architecture bien moins versatile de la carte, les 75 W de la nouvelle venue font fort, très fort même. Si les performances sont extrêmement variables, la moyenne est aux alentours d’une NVIDIA A30, qui pompe quant à elle... 165 W !

Une efficacité énergétique remarquable [cliquer pour agrandir]

Reste que l’écosystème n’est probablement pas aussi bien poli que celui des verts, sans compter que la comparaison avec l’architecture Ampère pourrait vite se retrouver obsolète si Mr Coronavirus voulait bien se calmer. Reste que la AI 100 marque un solide premier jet dans le genre pour Qualcomm, et pourrait intéresser bien des investisseurs, voire des acteurs privés puisque cette enveloppe thermique place la carte dans le collimateur des voitures autonomes et leur « Embedded High-Performance Computing », encore faut-il avoir la matière grise suffisante pour créer un réseau tirant pleinement parti du matériel disponible. Affaire à suivre.... (Source : EETimes et WikiChip)

Par ici pour les spécifications officielles du bousin

Un poil avant ?

AMD publie un pilote GPU important

Un peu plus tard ...

Windows 11 est là, comment le choper ?

7 nm, 75 W de TDP : sur le papier, le Cloud AI 100 de chez Qualcomm n'est pas un monstre de puissance : pourtant, l'efficacité énergétique est au rendez-vous.

2 minutes et demi

Sur le comptoir, au ~même sujet

	Entre Arm et Qualcomm, ce n’est pas vraiment l’amour fou
	Samsung aurait gagné les faveurs de NVIDIA et de Qualcomm pour son 3 nm
	Arm attaque Qualcomm en justice, mais que se passe-t-il ?
	Microsoft reconnait que le cloud gaming, c'est pas encore trop ça pour l'instant...
	Des fonds pour OVHCloud, son expansion et la souveraineté numérique européenne
	Faites une croix sur les cartes mères série 700 et les Ryzen AI 100, AMD aurait d’autres plans
	NVIDIA voudrait urger les livraisons de H100 et A100 vers la Chine avant l'application de la n...
	Le Snapdragon X Elite testé : à la hauteur des promesses de Qualcomm ?
	Qualcomm accusée de mentir sur les performances de ses Snapdragon X Elite / Plus
	Le Snapdragon X Elite s’échauffe dans Geekbench : au niveau des promesses de Qualcomm ?
	Dell révèle les plans d’Intel et de Qualcomm en matière de processeurs jusqu’en 2027
	Test • Fractal Pop Air, Pop Silent & Pop Mini