COMPTOIR
  
register

Vers une architecture Blackwell designée en chiplet chez NVIDIA ?

Les rumeurs sur l'emploi du design à chiplet pour la prochaine génération de GPU du caméléon s'intensifient, et comme la rumeur est la fumée du bruit, on peut penser qu'elle est justifiée d'autant que la source est plutôt fiable. Bien que Lovelace ait démontré que le monolithique avaient encore de belles marges de progression, et même Hopper, proposant un niveau de performance sans égal et des marges commerciales tout aussi sans égal, il serait peut être temps de revenir à des coûts de fabrication un peu plus mesurés pour sortir des GPU haut de gamme grandppublic ne chiffrant pas un SMIC brut, ce qui l'un des avantages du Mutli-Chip Module.

Rappelons en effet que Blackwell est censé apporter de l'unification des architectures pro & grand public. Les supposés GB100 et GB200, qui ne devraient pas atterrir avant 2025, serait ainsi plutôt destiné aux datacenters pour la première série et à la plèbe — artung grozz pinzettes — pour la seconde série. L'emploi d'un design en chiplet, à prendre là aussi avec un conditionnel très marqué, serait ainsi synonyme de plus de flexibilité pour déterminer les typologies de cartes et donc les gammes de produits en sous-divisant les composants du GPU sur plusieurs dies distincts. Il semblerait qu'au niveau architectural, les divergences Hopper VS Blackwell le seraient notamment au niveau des SMs, TPCs, CUDA cores, RT Cores ou encore des Tensor Cores en tête, plus que sur le nombre de GPCs ou de TPCs.

Un timing qui coïnciderait avec un retrait temporaire d'AMD sur le segment haut de gamme, laissant tout le champ nécessaire aux verts pour réorganiser leur offre grand public, qui de toute manière passera après la charge dévolue au segment de l'IA.

rumors coming cdh

L'occasion, alors que nous allons bientôt fêter l'anniversaire de naissance de Lovelace, était trop belle pour ne pas supputer de ce à quoi pourrait ressembler l'hypothétique RTX 5090 armée de son GB202 ; et c'est sur Chiphell qu'on s'y colle : 50 % de cores en rab', 50 % de bande passante en rab' (GDDR7 oblige), un gros boost du cache, un petit boost de 15 % en fréquence (le palier des 3 GHz en boost serait à portée), un bus de porc sur 448-bit (voire plus selon la configuration mémoire), le tout donnant un +170 % en perf. Et la conso dans tout ça ?

Un poil avant ?

Le Ray Tracing gagne en performances chez AMD... Sous Linux

Un peu plus tard ...

Le verre, ça sert à boire des coups, mais ça sert aussi à fabriquer des processeurs

Les 5 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Jemporte, le Dimanche 08 Octobre 2023 à 12h53  
par Un ragoteur sans nom du Grand Est¶, le Jeudi 21 Septembre 2023 à 17h00
vous avez raison continuez de de faire le buzz avec nvidia
Il y a du buzz chez AMD aussi.
Ils auraient abandonné leur architecture haut de gamme RDNA4.
Une des explications données : ils sont partis dans les chiplets à foison et leur haut de gamme emportait 20 chiplets cote à cote ou superposés. Il est probable qu'à un moment ne pas recourir à un gros chip mais à des chiplets à foison ne soit plus payant en terme de coûts, de complexité et de contraintes (il faut grouper les circuits alors qu'on est libre de dessiner sur une puce de silicium entière).
RDNA4 sortira en 2024 en 4nm seulement, RDNA5 en 2026 vraisemblablement, en 3nm. AMD aura une demi-gen de retard sur Nvidia et Intel en terme de gravure (et une gen complète sur Apple) et donc seront en retrait niveau perfs. Les vieilles habitudes reviennent.
par Pascal M., le Jeudi 21 Septembre 2023 à 17h51  
par Un ragoteur sans nom du Grand Est¶, le Jeudi 21 Septembre 2023 à 17h00
vous avez raison continuez de de faire le buzz avec nvidia
pourquoi le buzz ?
par Un ragoteur sans nom du Grand Est, le Jeudi 21 Septembre 2023 à 17h00  
vous avez raison continuez de de faire le buzz avec nvidia
Message de Tux4 embusqué supprimé par un modérateur : ortograf dégeulasse
par Jemporte, le Lundi 18 Septembre 2023 à 18h28  
Les architectures pro et grand public ont divergé il y peu. D'ailleurs à part pour le très haut de gamme data center il y des emplois mixtes.
C'est chez AMD que la chose est devenue la plus évidente, sans que la version pro progresse d'ailleurs, plutôt l'inverse.

Est-ce que chez Nvidia ça signifie un retour en force des FP64 sur les CUDA cores ?

Par ailleurs j'avais remarqué que Nvidia, n'a probablement pas séparé sur le chip du GPU la partie CUDA, Tenseurs et RT pour rien. Ca permettrait de séparer ces fonctionnalités sur 3 chips et donc réduire la taille générale du chip gravé et diminuer l'ensemble des chips à défaut dans les gravures ultimes récentes. Et ça permet aussi de cibler le domaine d'application du chip en faisant varier les capacités à chaque niveau.

Pour la bande passante de la RTX 5090, il ne faut pas oublier en plus de la GGDR7, le retour du bus 512 bits.

Pour ce qui est des rumeurs d'AMD supprimant son futur Navi 41, il y a une rumeur que ce chip pourrait être remplacé par du multichip Navi 42 encore plus performant et moins cher. Donc 2 GCD Navi 42 + 8 MCD de cache pour 32Go de GDDR7. Aucune des deux rumeurs ne se contredit. Le retrait du haut de gamme, n'étant qu'un raccourci résultat de la disparition du GCD Navi 41. Ca inverserait alors le débat.