COMPTOIR
  
register

×

RDNA 3 chiplets design

Test • AMD Radeon RX 7900 XT & RX 7900 XTX
RDNA 3 chiplets design
RDNA 3 chiplets design
RDNA 3 chiplets interconnexion design vs epyc
RDNA 3 chiplets interconnexion design
RDNA 3 chiplets interconnexion design
La technologie pour l'interconnexion
La complexité d'une telle interconnexion
L'efficacité énergétique de la solution retenue
Les performances de l'interconnexion

• RDNA3 : des Chiplets sur GPU

Si AMD a réussi à se montrer aussi compétitif ces dernières années dans le domaine des CPU grand public, il le doit à une architecture efficace couplée à une efficacité industrielle remarquable. Cela passe par une attention particulière apportée au design de ses puces pour minimiser la taille nécessaire, tout en couplant cela avec une approche innovante, les chiplets. Si vous êtes un lecteur régulier de nos colonnes, ce terme doit vous être familier, pour les autres, voici une définition simple du concept : au lieu de concevoir une seule puce monolithique de taille conséquente, il est préférable selon AMD, de créer plusieurs puces plus petites dédiés à des fonctions précises. Elles seront ainsi plus aisées à produire et pourront utiliser des procédés de fabrication différents. 

 

RDNA 3 chiplets design [cliquer pour agrandir]

 

Pourquoi utiliser des procédés de fabrication distincts ? Selon les rouges, la raison principale provient du fait que certaines parties d'un GPU ne profitent que très peu des nouvelles finesses de gravure, tant du côté de la densité que des performances des transistors. Comme dans le même temps, le coût de production des dernières lithographies devient de plus en plus important, il parait plus que légitime de réserver ces dernières aux éléments qui vont en tirer bénéfice (les unités logiques) et se contenter d'un procédé moins coûteux pour d'autres (interfaces & mémoires).

 

RDNA 3 chiplets design [cliquer pour agrandir]

 

Voilà pour la théorie, mais identifier les éléments qui vont pouvoir profiter ou non de l'amélioration de la lithographie est une chose, être capable de les désolidariser au sein de dies séparés, en est une toute autre. Car le plus gros défi qui se pose ici, vient de la complexité de l'interconnexion entres éléments d'un GPU, sans comparaison avec celle d'un CPU. Pour imager cela, AMD compare le besoin d'interfaçage entre dies d'un CPU Epyc et de "blocs comparables" au sein d'un GPU. Le rapport de complexité est de 1 pour 100, ce qui signifie que les rouges ne pouvaient pas se contenter de copier-coller la solution existante pour ses CPU.

 

RDNA 3 chiplets interconnexion design vs epyc [cliquer pour agrandir]

 

Pour commencer, il a fallu déterminer où procéder à la partition. Après analyse, les rouges ont identifié que le cache L3 qui constitue l'avancée majeur de RDNA 2, profitait finalement assez peu d'un passage à la gravure 5 nm. Il en est de même pour les interface GDDR6, ce sont donc ces éléments qui ont été logiquement désignés comme pertinents à extraire du die 5 nm, pour les transférer sur des chiplets annexes, conservant un procédé de gravure similaire à la génération précédente.

 

RDNA 3 chiplets interconnexion design [cliquer pour agrandir]

 

Voilà pour répondre à la question "où pratiquer la séparation au sein d'un GPU ?", restait maintenant à définir le "comment procéder ?". Car ce n'est pas une mince affaire, sachant que la bande passante nécessaire entre GCD-MCD, est plus de 10 fois supérieure à celle entre chiplets CPU. Il a donc fallu revoir les techniques de packaging pour proposer une interface jusqu'à présent inédite entre dies.

 

RDNA 3 chiplets interconnexion design [cliquer pour agrandir]

 

Cette dernière est nommée Infinity Fanout Links par AMD. Comme son nom l'indique, elle s'appuie sur l'Infinity Fabric qui autorise dans cette implémentation, jusqu'à 9,2 Gb/s. La bande passante cumulée de tous les MCD avec le GCD, culmine à 5,3 To/s, soit un peu moins de 900 Go/s entre un MCD et le GCD. 

 

La technologie pour l'interconnexion [cliquer pour agrandir]

 

Pour cette interconnexion au sein du packaging, AMD n'utilise plus de substrat organique comme c'était le cas jusqu'à présent. Les rouges ne vont pas plus loin dans les détails à ce niveau, cela doit de toute façon faire appel à de la chimie complexe, excédant nos compétences en la matière. Ce qu'il faut en retenir, c'est que cette technologie permet de doubler le nombre de lignes d'interconnexion au sein de l'interface, en comparaison de ce qui peut se faire via un traditionnel substrat organique.

 

La complexité d'une telle interconnexion [cliquer pour agrandir]

 

AMD précise également que cette interface n'est pas seulement performante, elle a aussi été développée pour être économe. Pour ce faire, la tension de fonctionnement est faible, et l'ajustement des fréquences est très agressif, pour permettre de réduire ces dernières dès que c'est possible. Selon les rouges, cela permettrait de sauver 80 % d'énergie par bit, en comparaison de liens d'un packaging traditionnel. Au final, une bande passante effective de 3,5 To/s, ne couterait que 5% de la puissance électrique totale du GPU d'après AMD.

 

L'efficacité énergétique de la solution retenue [cliquer pour agrandir]

 

Un dernier mot concernant l'augmentation de latence induite par cette interface. Toujours selon AMD, cette dernière serait limitée en comparaison d'une approche monolithique traditionnelle. Néanmoins, pour la compenser, AMD a augmenté de respectivement 43 % et 18 % la fréquence de fonctionnement de l'Infinity Fabric et du GPU. Ces deux actions combinées, conduiraient à une baisse de 10 % de la latence d'accès au cache L3 sur Navi 31, en comparaison de celle mesurée pour Navi 21.

 

Les performances de l'interconnexion [cliquer pour agrandir]

 

Voilà c'est tout pour cette partie, jetons à présent un coup d'œil plus précis sur Navi 31, page suivante.



Un poil avant ?

Combien de RX 7900 sur les étalages pour finir 2022 ?

Un peu plus tard ...

Ventes de jeux vidéo : la fameuse nain-posture

Les 143 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Jemporte, le Jeudi 22 Décembre 2022 à 21h52  
Très bof cette carte Aorus à part au niveau sonore. C'est le résultat du gabarit.
Sinon les perfs progressent peu au regard du peu de progrès fréquences. Diffcile de constater du coup l'influence d'un maque de prefetch. Il faudrait une carte watercoolée pour ce faire.
par Beguemotx en Île-de-France, le Jeudi 22 Décembre 2022 à 17h26  
Merci pour votre test complet. On va attendre des optimisations ou la prochaine génération.
par Un ragoteur qui pipotronne du Grand Est, le Lundi 19 Décembre 2022 à 10h21  
par Francois2A embusqué le Vendredi 16 Décembre 2022 à 12h03
Moi qui comptait changer ma Vega64 par une 7900XT, je suis bien dégouté...
La logique voudrait qu'il faille encore attendre 1 à 2 ans, mais je ne me hasarderais pas à parier sur l'évolution des GPU d'ici-là... en particulier côté tarifs.

Pour l'explication de cette estimation : Cf. R600 (-> RV670 -> RV770) et Evergreen/TeraScale 2 (qui me semble bien correspondre à RDNA3). AMD semble arrivé au bout de son axe de développement et il conviendrait donc d'attendre la prochaine architecture pour que certains problèmes soient enfin corrigés.

PS : En version mobile, il existe une zone de menu fantôme bien casse-bonbons en haut de l'écran.
par Un énarque des ragots du Grand Est, le Lundi 19 Décembre 2022 à 09h16  
C'est bonà savoir, on peut donc aussi aller chercher quelques dB de moins contre quelques degrés de plus au final (ou partir sur une custom qui fait moins de bruit, si un partenaire a la bonne idée de partir dans cette direction).
par Thibaut G., le Dimanche 18 Décembre 2022 à 08h37  
par Scrabble le Vendredi 16 Décembre 2022 à 13h36
Ca c'est normal, ça s'explique par la compacité de la CG. Tu peut y remédier en bridant la limite de puissance de la CG, avec une perte minimale de performances, donc c'est pas un gros défaut
la carte est pas super compacte, plus longue et plus epaisse que la 6900xt, c'ets pas ça qui explique les nuisances sonores.c'est le choix d'AMD de la courbe de ventilation, car en charge elles sont à moins de 70°C, alors que les RDNA 2 étaient à plus de 80. Sur cette Gen, elles chauffent moins et font plus de bruit parce que les rouges ont calibré la courbe ainsi, ce n'est pas une tare technologique, c'est un choix.
par Un ragoteur en Île-de-France, le Dimanche 18 Décembre 2022 à 02h08  
par Scrabble le Vendredi 16 Décembre 2022 à 13h36
Ca c'est normal, ça s'explique par la compacité de la CG. Tu peut y remédier en bridant la limite de puissance de la CG, avec une perte minimale de performances, donc c'est pas un gros défaut
Oui c'est sur, on achete une xtx pour la brider...

46 db, faut arrêter d'en faire un fromage. Pas besoin dy remédier.
Je pense que lorsque on achete une carte à plus de 1000 euros, on a la bonne idée d'acheter un bon boîtier qui restera un bon investissement et de lui fournir un refroidissement digne de ce nom.
Tout comme l'alimentation, faut y mettre 150 euros.
Faut savoir ce que l'on veut.
par Scrabble, le Vendredi 16 Décembre 2022 à 13h36  
par Francois2A embusqué le Vendredi 16 Décembre 2022 à 12h03
2 / Le bruit en jeu... 46.7dB pour la XTX !! C'est pas possible ça ?
Ca c'est normal, ça s'explique par la compacité de la CG. Tu peut y remédier en bridant la limite de puissance de la CG, avec une perte minimale de performances, donc c'est pas un gros défaut
par Francois2A embusqué, le Vendredi 16 Décembre 2022 à 12h03  
Vraiment déçu pour ma part... les performances sont bonnes pour le prix face à Nvidia, MAIS, il y a 2 points rédhibitoires selon moi.
1 / La conso en idle.... 100W !! C'est une blague ?
2 / Le bruit en jeu... 46.7dB pour la XTX !! C'est pas possible ça ?

Mise à part ces 2 points, il y a aussi le tarif élevé de la XT face à la XTX, le RT qui n'est pas au niveau (mais ça franchement je m'en tape), et on peut oublier l'OC.

Moi qui comptait changer ma Vega64 par une 7900XT, je suis bien dégouté...
par synch81, le Vendredi 16 Décembre 2022 à 08h11  
par Un ragoteur sans nom en Île-de-France le Jeudi 15 Décembre 2022 à 20h31
Il faudrait que tu fasses une partie de need for speed heat avec ou sans RT.
Ça dépend surtout du jeu.
J'admet, j'exagère un poil

Je connais pas le dernier NFS.

Le dernier que j'ai fait c'était underground? quelque chose comme ca, ca remonte

par Un ragoteur sans nom en Île-de-France, le Jeudi 15 Décembre 2022 à 20h31  
par synch81 le Jeudi 15 Décembre 2022 à 10h08
Les gens font ce qu'ils souhaitent de leurs sous et encore heureux

Concernant l'exploitation de l'effet en lui même, il n'y a pas un jeu avec du RT fait de manière mesuré. C'est plutôt du bling-bling matuvu ou rien (comprendre trop discret pour etre utile). Taillé pour en mettre plein la vue (contrairement a ce qu'on voit sur les vrais rendu 3D exploitant le RT dans les logiciel comme C4D, 3dsmax, Maya etc)

Avec la démocratisation des différentes solutions, je pense que les Dev vont chercher a se démarquer et exploiter plus finement le RT. Par ce que bon, la flotte a tout vas c'est cool 5 minutes mais bon
Il faudrait que tu fasses une partie de need for speed heat avec ou sans RT.
Ça dépend surtout du jeu.

par Un ragoteur sans nom en Île-de-France, le Jeudi 15 Décembre 2022 à 20h26  
par Superubu le Mercredi 14 Décembre 2022 à 13h43
S'il pouvait rester stoïquement silencieux ça nous ferait des vacances

En passant, j'ajoute que les ragoteurs de mauvaise humeur le sont souvent car le gars se permet de juger les autres à tors et à travers et ne justifie jamais ce qu'il avance. Ce n'est clairement pas une victime, faut arrêter de déconner.
Notons également que Jemporte n'a pas répondu à Eric.
Ça veut tout dire.
par Un ragoteur RGB en Bourgogne-Franche-Comté, le Jeudi 15 Décembre 2022 à 14h15  
Vous ne parlez que de la partie reflet de la lumière et vous oubliez le reste. Les effets d'illumination volumétrique et d'ombrage font partie du RT et sont diablement convaincants.