Sapphire Rapids sera équipé d'AMX, une nouvelle extension x86 d'Intel

RTX 5070 TI : 68 refs en stock de 797.00 € à 1497.16 € Tendance haussière
RTX 5090 : 42 refs en stock de 2422.78 € à 4301.97 € Tendance haussière
RADEON RX 9070 : 43 refs en stock de 557.99 € à 988.90 € Tendance baissière
RADEON RX 9070 XT : 61 refs en stock de 593.99 € à 970.68 € Tendance haussière
RADEON RX 9060 XT : 69 refs en stock de 309.00 € à 498.06 € Tendance baissière
RTX 5060 : 98 refs en stock de 274.55 € à 550.07 € Tendance haussière
RTX 5060 Ti : 116 refs en stock de 359.10 € à 682.35 € Tendance baissière
Core Ultra 5 245K : 8 refs en stock de 237.88 € à 369.99 € Tendance haussière
Core Ultra 7 265K : 9 refs en stock de 287.99 € à 499.90 € Tendance baissière
Core i7-14700k : 14 refs en stock de 319.00 € à 459.90 € Tendance haussière
Core Ultra 9 285K : 2 refs en stock de 635.66 € à 729.99 € Tendance baissière
Ryzen 5800X3D : 1 ref en stock à 544.16 € Tendance haussière
RTX 4060 ti : 29 refs en stock de 322.99 € à 14359.75 € Tendance baissière
Tendance haussière
RTX 4070 TI SUPER : 1 ref en stock à 1217.93 € Tendance haussière
Ryzen 9700X : 1 ref en stock à 399.90 € Tendance haussière
Ryzen 7700X : 3 refs en stock de 263.00 € à 349.99 € Tendance baissière
Ryzen 7800X3D : 7 refs en stock de 329.99 € à 537.00 € Tendance baissière
ryzen 9800X3D : 7 refs en stock de 466.00 € à 614.99 € Tendance haussière
Ryzen 9900X : 5 refs en stock de 384.00 € à 584.00 € Tendance baissière
RTX 4090 : 8 refs en stock de 2499.99 € à 2989.99 € Tendance baissière
RADEON RX 7700 XT : 13 refs en stock de 399.00 € à 567.99 € Tendance haussière
Ryzen 7950X3D : 5 refs en stock de 637.00 € à 829.99 € Tendance baissière
PS5 Pro : 4 refs en stock de 741.76 € à 799.99 € Tendance haussière

La réception • Actualités • Processeurs

De nos jours, les processeurs de bureau utilisent le jeu d’instruction x86, ce qui signifie qu’ils sont capables de décoder un bon paquet de petits morceaux de code binaire, nommés « instructions » permettant d’assurer la rétrocompatibilité (théorique) avec les tout premiers CPU de cette famille, sortis dans la fin des années 70. Pour un petit mémo à ce sujet, nous vous avions concocté un dossier expliquant son fonctionnement il y a quelques années.

Or, la nouvelle du jour concerne justement une amélioration, à la fois dans le jeu d’instruction, mais aussi dans la conception des futurs processeurs de la série Sapphire Rapids. Pour cela, contextualisons encore davantage la situation : le langage x86 contient les instructions originelles de l’Intel 8086, mais a également été enrichi au fur et à mesure par des extensions du jeu d’instruction, tel le SGX pour fournir une plateforme sécurisée de calcul, le MMX pour des calculs dédiés au décodage multimédia ou encore le SSE pour effectuer plusieurs opérations simples en parallèle. Plus récemment, avec la sortie de la série Cooper Lake sur la Scalable Platform, Intel a dû revoir son implémentation des extensions VNNI (dédiées au machine learning) pour le rendre compatible avec le BFloat16, une réorganisation de la manière de représenter les nombres à virgules 16 bits afin d’offrir une étendue qui correspond mieux aux réseaux de neurones, au détriment de la précision.

Un DL Boost en théorie 2 fois plus performant [cliquer pour agrandir]

VNNI, DL Boost : deux termes pour une seule chose !

Concrètement, ce VNNI n’était pas une extension majeure, dans le sens où les opérations fournies sont exécutées grâce aux registres et aux unités de calcul dédiées à l’AVX-512 : les seuls changements ont dû être effectués au niveau du décodage de l’instruction (il faut désormais une seule instruction pour un calcul qui en nécessitait deux... mais la moulinette derrière reste identique) — ce qui retire un possible goulot d’étranglement, soyons clairs, mais ne nécessite pas de refonte profonde de l’organisation logique du CPU. En somme, les instructions VNNI ne seront efficaces que dans les cas où le processeur était limité par le décodage de ses instructions, ce qui n’inclut donc pas les situations, pourtant courantes, où le débit RAM n’est pas suffisant. De même, le BFloat16 revient à tronquer la représentation préexistante Float32 en rognant sur les bits de précision : il y a ici aussi fort à parier que les modifications du silicium ont été minimes.

intel server roadmap 2020 with amx

À l’inverse, les Xeon Sapphire Rapids, prévus pour 2021, amorceraient une nouvelle direction — alors même qu’Ice Lake régressera en abandonnant temporairement ce BFloat16, une décision qui se passe de commentaires — en rajoutant les Advanced Matrix Extensions (AMX), composées de 8 nouveaux registres capables de contenir des matrices d’une taille de 1 ko, soit 16 valeurs 64-bit (organisation ligne/colonne libre via un registre de configuration), doublant ainsi les tensors cores de NVIDIA qui bossent, eux, sur des registres ne contenant que 8 valeurs maximum, les verts en intègrent 432 sur leur dernière A100. Pour les manipuler, il faudra compter sur 12 nouvelles instructions, un nombre relativement faible étant donnée la diversité des opérations : outre les classiques chargements et rangements, le cœur de la puissance sera le produit matriciel, une opération combinant plusieurs produits scalaires vectoriels en parallèle, ô combien cruciale pour le machine learning et le calcul scientifique. Notez d'ailleurs que ces AMX pourront également opérer sur les entiers 8-bit ainsi qu'un BFloat16, tant qu'à faire, c'est cadeau !

Est-ce que cela sera utile pour d’autres applications (au hasard, pour les joueurs ou le grand public) ? Difficile à dire, bien qu’il soit clair que les applications proches du domaine professionnel comme la retouche photographique ou la modélisation 3D, un passe-temps pour certains, devraient en sortir accélérées — tout comme les benchmarks synthétiques se basant principalement sur des calculs matriciels. Vivement les tests indépendants ! (Source : WikiChip)

Un poil avant ?

Des WD Red mal étiquetés et toujours mal emballés chez Amazon ?

Un peu plus tard ...

Nvidia et AMD, les ventes "serveur" au beau fixe

Pour les Xeon de la Scalable Platform, le passage en 10 nm s'accompagnera, un an plus tard, d'améliorations architecturales pour le deep learning, toujours !

à vue de nez disons heuu moins de 3 minutes

Sur le comptoir, au ~même sujet

	Xeon W-3500 et W-2500 : Intel rafraîchit ses Sapphire Rapids
	La GH200 de NVIDIA se confronte aux processeurs AMD EPYC et Intel Xeon
	Test • Intel Core i9-14900K, Core i7-14700K & Core i5-14600K
	La fin des grille-pains chez Intel ? Arrow Lake-S n'est pas meilleur mais chauffe moins que Raptor
	L’Intel Baseline Profile diminue d’environ 9 % les performances du Core i9-14900K
	Core i9-14900KS : Intel persiste dans la surenchère de GHz et de watts
	Intel milite désormais en faveur d'ordinateurs plus écolos
	Intel et AMD désormais partenaires, pour le bien du x86
	Intel Nova Lake-S : jusqu’à 52 cœurs CPU et support natif de la DDR5-8000
	x86 : le choc de simplification d'Intel, ce ne sera pas pour tout de suite
	NVIDIA incrimine les CPU Raptor Lake d'Intel pour les instabilités dans les jeux
	Cartes graphiques B580 et B570, XeSS 2 avec Frame Generation ; Intel prend l’initiative