COMPTOIR
  
register

×

RDNA 3 main specs

Test • AMD Radeon RX 7900 XT & RX 7900 XTX
RDNA 3 main specs
RDNA 3 architecture
RDNA 3 compute units refreshed
RDNA 3 vector units
RDNA 3 vector units
RDNA 3 ray tracing
RDNA 3 ray tracing
RDNA 3 ray tracing
RDNA 3 cache improvements

• RDNA3 : Une architecture remaniée

Pour vous aider dans la compréhension des pages à venir, nous vous invitons vivement à lire ou relire, si ce n'est pas déjà fait, celles que nous avions dédiées à RDNA au sein de ce dossier et son successeur ici. Cette architecture RDNA, est une refonte profonde de la précédente (GCN), avec pour objectif d'améliorer drastiquement les performances par watt. Pour ce faire, AMD a sérieusement revu l'organisation de ses unités de calculs, mais aussi le sous-système mémoire, en particulier la hiérarchie des caches. Pour la seconde itération de cette architecture, les rouges ont poursuivi dans ce sens avec 3 contributeurs principaux à l'amélioration. Le premier est l'augmentation significative de l'IPC, en particulier avec l'inclusion d'un cache de niveau 3. Le second est la réduction de la puissance nécessaire pour atteindre une fréquence donnée ou exécuter certaines tâches, et enfin le dernier consiste à améliorer la capacité à monter en fréquence de l'architecture. Le tout combiné, permettait un gain de 54% au niveau du rapport performances par watt. Quels sont cette fois les contributeurs qui ont présidé à la naissance de RDNA3 ?

 

RDNA 3 main specs [cliquer pour agrandir]

 

Nous détaillerons les parties chiplet et display/media engine dans les pages suivantes, pour nous concentrer sur l'architecture au sein de celle-ci. Commençons par le diagramme de blocks de Navi 31. Tout comme son prédécesseur, nous y retrouvons les composants standards des rouges. Un processeur de commande central est toujours chargé de planifier et ordonner les différents threads. Selon AMD, il est à présent 2,3x plus performant que son prédécesseur pour les commandes de rendus multiples, permettant de réduire l'overhead CPU au niveau des pilotes ou de l'API.

 

A ses côtés, se trouvent les unités chargées de l'organisation et de la gestion des tâches Compute, ainsi qu'un processeur géométrique central et le cache L2. Diverses interfaces, moteurs vidéo & d'affichage, complètent cette partie du GPU. Le cache L3 et les contrôleurs mémoires sont à présent répartis au sein de 6 dies dédiés (cf. page suivante). Le bus mémoire passe donc à 384-bit, par contre le L3 se voit amputé d'un quart, avec 96 Mo maximum, contre 128 Mo précédemment sur Navi 21.

 

Enfin, l'exécution des programmes est toujours réalisée au sein des Shaders Engine, dont le nombre progresse de 50 % également, à 6 en tout. Chacun dispose de leurs propres cache L1, unité de rastérisation (découpe des triangles en pixels), Primitive Unit (génération et traitement des triangles), ainsi que 32 ROP (unité de rendu/sortie) et 8 Dual Compute Unit, (contre 10 par Shader Engine sur Navi 21) comprenant comme leur nom l'indique, 2 CU. Au final leur nombre total progresse donc de 20%, à 96 en tout.

 

RDNA 3 architecture [cliquer pour agrandir]

 

Concentrons nous donc à présent sur ces Compute Unit Pair ou Dual CU. Leur structure est très similaire à celle de la génération précédente, on notera tout de même un ajout notable via la présence d'une unité matricielle que nous détaillerons un peu plus bas.

 

RDNA 3 compute units refreshed [cliquer pour agrandir]

 

Mais similaire ne veut pas dire identique, loin de là. Car une des nouveautés de ces Compute Units, est la possibilité de doubler le taux d'exécution via Dual Issue. Comment tout cela fonctionne-t-il ? Eh bien AMD a tout simplement doublé le nombre d'ALU FP32 par SP au sein des unités SIMD, qui sont donc théoriquement capables d'exécuter 2 instructions par cycle. Toutefois, afin que l'implémentation ne soit pas trop coûteuse, il y a des contraintes à leur utilisation. Ainsi, ce doublement n'est effectif que lorsque le compilateur est capable d'extraire une seconde instruction d'un même WaveFront (liste de tâches à traiter envoyées au GPU). C'est mine de rien un gros changement de philosophie, et si RDNA 2 ne changeait pas grand chose à ce niveau par rapport à l'itération originelle, ce n'est pas le cas ici. L'efficacité de cette implémentation dépendra donc fortement de la partie logicielle en fonction du type de tâches à traiter.

 

RDNA 3 vector units [cliquer pour agrandir]

 

Autre gros changement que nous évoquions précédemment, l'ajout d'unités matricielles permettant de traiter beaucoup plus rapidement les faibles précisions. Cet usage est fortement utilisé en IA, en particulier pour les tâches d'inférence, mais aussi d'apprentissage. AMD rejoint donc Nvidia et Intel en implémentant de telles unités au sein de leur GPU grand public. Reste à voir ce qu'en feront les rouges dans le domaine ludique, puisque le FSR par exemple, n'utilise pour l'heure pas l'IA.

 

RDNA 3 vector units [cliquer pour agrandir]

 

Un des points faibles avérés de RDNA2, est son implémentation faiblarde de l'accélération du BVH pour le Ray Tracing. AMD indique avoir retravaillé cela sur plusieurs axes. Le premier est la prise en charge de marqueurs géométriques, permettant d'éviter de lancer une traversée du BVH pour rechercher une intersection entre rayon et triangle, si ce dernier peut-être éjecté préalablement (culling) car non visible dans une scène.

 

RDNA 3 ray tracing [cliquer pour agrandir]

 

Le second point d'amélioration concerne le filtrage et tri des rayons préalablement à leur entrée dans le BVH, afin d'éviter des itérations supplémentaires lors de la traversée de ce dernier. Ainsi, les rayons sont classés en fonction de la distance les séparant du premier impact, mais aussi ceux qui vont présenter des chevauchements (ombres) ou se terminant à la première intersection.

 

RDNA 3 ray tracing [cliquer pour agrandir]

 

Enfin, la dernière optimisation est une prise en charge Hardware directement au sein des Ray Accelerator, de l'ordonnancement et la traversée du BVH, qui étaient auparavant directement réalisés via shaders sur les unités de calcul traditionnelles, les libérant ainsi pour d'autres tâches. AMD précise également qu'un nouvel algorithme d'ordonnancement permettrait d'optimiser l'usage des ressources, à l'image du SER des verts ou de son équivalent chez les bleus. Enfin, les rouges indiquent que le débit brut de ces Ray Accelerator, progresse de 50 % par rapport à la génération précédente.

 

RDNA 3 ray tracing [cliquer pour agrandir]

 

Un mot concernant les différents caches. Le L2 progresse de 50 %, suivant ainsi l'augmentation du nombre de Shader Engines, la progression est par contre plus marquée pour les L0 et L1, qui sont eux, doublés. En définitive, seul le L3 (Infinity Cache) recul au niveau de sa capacité, comme précisé en début de page. On notera également une progression de certains débits entre niveaux de cache.

 

RDNA 3 cache improvements [cliquer pour agrandir]

 

Voilà ce que nous pouvions vous dire sur cette architecture, passons à présent à l'autre évolution notable apportée par RDNA3 sur Navi 31.



Un poil avant ?

Combien de RX 7900 sur les étalages pour finir 2022 ?

Un peu plus tard ...

Ventes de jeux vidéo : la fameuse nain-posture

Les 143 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Jemporte, le Jeudi 22 Décembre 2022 à 21h52  
Très bof cette carte Aorus à part au niveau sonore. C'est le résultat du gabarit.
Sinon les perfs progressent peu au regard du peu de progrès fréquences. Diffcile de constater du coup l'influence d'un maque de prefetch. Il faudrait une carte watercoolée pour ce faire.
par Beguemotx en Île-de-France, le Jeudi 22 Décembre 2022 à 17h26  
Merci pour votre test complet. On va attendre des optimisations ou la prochaine génération.
par Un ragoteur qui pipotronne du Grand Est, le Lundi 19 Décembre 2022 à 10h21  
par Francois2A embusqué le Vendredi 16 Décembre 2022 à 12h03
Moi qui comptait changer ma Vega64 par une 7900XT, je suis bien dégouté...
La logique voudrait qu'il faille encore attendre 1 à 2 ans, mais je ne me hasarderais pas à parier sur l'évolution des GPU d'ici-là... en particulier côté tarifs.

Pour l'explication de cette estimation : Cf. R600 (-> RV670 -> RV770) et Evergreen/TeraScale 2 (qui me semble bien correspondre à RDNA3). AMD semble arrivé au bout de son axe de développement et il conviendrait donc d'attendre la prochaine architecture pour que certains problèmes soient enfin corrigés.

PS : En version mobile, il existe une zone de menu fantôme bien casse-bonbons en haut de l'écran.
par Un énarque des ragots du Grand Est, le Lundi 19 Décembre 2022 à 09h16  
C'est bonà savoir, on peut donc aussi aller chercher quelques dB de moins contre quelques degrés de plus au final (ou partir sur une custom qui fait moins de bruit, si un partenaire a la bonne idée de partir dans cette direction).
par Thibaut G., le Dimanche 18 Décembre 2022 à 08h37  
par Scrabble le Vendredi 16 Décembre 2022 à 13h36
Ca c'est normal, ça s'explique par la compacité de la CG. Tu peut y remédier en bridant la limite de puissance de la CG, avec une perte minimale de performances, donc c'est pas un gros défaut
la carte est pas super compacte, plus longue et plus epaisse que la 6900xt, c'ets pas ça qui explique les nuisances sonores.c'est le choix d'AMD de la courbe de ventilation, car en charge elles sont à moins de 70°C, alors que les RDNA 2 étaient à plus de 80. Sur cette Gen, elles chauffent moins et font plus de bruit parce que les rouges ont calibré la courbe ainsi, ce n'est pas une tare technologique, c'est un choix.
par Un ragoteur en Île-de-France, le Dimanche 18 Décembre 2022 à 02h08  
par Scrabble le Vendredi 16 Décembre 2022 à 13h36
Ca c'est normal, ça s'explique par la compacité de la CG. Tu peut y remédier en bridant la limite de puissance de la CG, avec une perte minimale de performances, donc c'est pas un gros défaut
Oui c'est sur, on achete une xtx pour la brider...

46 db, faut arrêter d'en faire un fromage. Pas besoin dy remédier.
Je pense que lorsque on achete une carte à plus de 1000 euros, on a la bonne idée d'acheter un bon boîtier qui restera un bon investissement et de lui fournir un refroidissement digne de ce nom.
Tout comme l'alimentation, faut y mettre 150 euros.
Faut savoir ce que l'on veut.
par Scrabble, le Vendredi 16 Décembre 2022 à 13h36  
par Francois2A embusqué le Vendredi 16 Décembre 2022 à 12h03
2 / Le bruit en jeu... 46.7dB pour la XTX !! C'est pas possible ça ?
Ca c'est normal, ça s'explique par la compacité de la CG. Tu peut y remédier en bridant la limite de puissance de la CG, avec une perte minimale de performances, donc c'est pas un gros défaut
par Francois2A embusqué, le Vendredi 16 Décembre 2022 à 12h03  
Vraiment déçu pour ma part... les performances sont bonnes pour le prix face à Nvidia, MAIS, il y a 2 points rédhibitoires selon moi.
1 / La conso en idle.... 100W !! C'est une blague ?
2 / Le bruit en jeu... 46.7dB pour la XTX !! C'est pas possible ça ?

Mise à part ces 2 points, il y a aussi le tarif élevé de la XT face à la XTX, le RT qui n'est pas au niveau (mais ça franchement je m'en tape), et on peut oublier l'OC.

Moi qui comptait changer ma Vega64 par une 7900XT, je suis bien dégouté...
par synch81, le Vendredi 16 Décembre 2022 à 08h11  
par Un ragoteur sans nom en Île-de-France le Jeudi 15 Décembre 2022 à 20h31
Il faudrait que tu fasses une partie de need for speed heat avec ou sans RT.
Ça dépend surtout du jeu.
J'admet, j'exagère un poil

Je connais pas le dernier NFS.

Le dernier que j'ai fait c'était underground? quelque chose comme ca, ca remonte

par Un ragoteur sans nom en Île-de-France, le Jeudi 15 Décembre 2022 à 20h31  
par synch81 le Jeudi 15 Décembre 2022 à 10h08
Les gens font ce qu'ils souhaitent de leurs sous et encore heureux

Concernant l'exploitation de l'effet en lui même, il n'y a pas un jeu avec du RT fait de manière mesuré. C'est plutôt du bling-bling matuvu ou rien (comprendre trop discret pour etre utile). Taillé pour en mettre plein la vue (contrairement a ce qu'on voit sur les vrais rendu 3D exploitant le RT dans les logiciel comme C4D, 3dsmax, Maya etc)

Avec la démocratisation des différentes solutions, je pense que les Dev vont chercher a se démarquer et exploiter plus finement le RT. Par ce que bon, la flotte a tout vas c'est cool 5 minutes mais bon
Il faudrait que tu fasses une partie de need for speed heat avec ou sans RT.
Ça dépend surtout du jeu.

par Un ragoteur sans nom en Île-de-France, le Jeudi 15 Décembre 2022 à 20h26  
par Superubu le Mercredi 14 Décembre 2022 à 13h43
S'il pouvait rester stoïquement silencieux ça nous ferait des vacances

En passant, j'ajoute que les ragoteurs de mauvaise humeur le sont souvent car le gars se permet de juger les autres à tors et à travers et ne justifie jamais ce qu'il avance. Ce n'est clairement pas une victime, faut arrêter de déconner.
Notons également que Jemporte n'a pas répondu à Eric.
Ça veut tout dire.
par Un ragoteur RGB en Bourgogne-Franche-Comté, le Jeudi 15 Décembre 2022 à 14h15  
Vous ne parlez que de la partie reflet de la lumière et vous oubliez le reste. Les effets d'illumination volumétrique et d'ombrage font partie du RT et sont diablement convaincants.