Test • AMD Radeon RX 6800 & RX 6800 XT |
————— 18 Novembre 2020
Test • AMD Radeon RX 6800 & RX 6800 XT |
————— 18 Novembre 2020
Navi 21, est le premier GPU à étrenner l'architecture RDNA2. Il était souvent affublé du terme Big Navi par le passé, lorsqu'on souhaitait parler de la future puce haut de gamme de génération Navi. Son sobriquet ne mentait pas, puisqu'elle mesure pas moins de 519,8 mm² tout en étant gravée par TSMC, à l'aide de son process 7 nm. C'est donc un beau bébé, plus grand que Vega 10 par exemple, certes moins imposant que les dernières créations du caméléon, mais utilisant un procédé de fabrication plus performant.
Navi 21 dans toute sa splendeur
Il est toutefois utile et important de préciser qu'à ce niveau, il n'y a pas un, mais des 7 nm disponibles chez TSMC. Après l'introduction initiale de ce nœud de gravure, une version "Performance" est apparue (augmentant densité et efficacité énergétique), puis une version "+" a été lancée utilisant l'EUV, pour là aussi améliorer ces deux points, ainsi que le rendement de production. AMD n'est pas prolixe sur le sujet, tout juste retrouvons-nous sur le slide suivant la phrase "same 7 nm technology", sans savoir exactement si cela signifie ici le même nœud de gravure ou la même déclinaison au sein de ce dernier. Toutefois, AMD insiste sur le fait que les gains seraient à mettre au crédit des évolutions architecturales, allant dans le sens de la première hypothèse.
Si concernant la performance des transistors de chaque procédé de gravure, on ne peut que se baser sur les dires des fondeurs, difficilement comparables entre eux, pour la densité, les informations d'AMD et Nvidia permettent de réaliser des ratios entre GPU. Même si cet élément n'a pas grande importance pour le client final, il permet de se faire une petite idée des coûts de production.
Gravure | GPU | Nombre de transistors | Superficie Die |
Densité (Millions de transistors / mm²) |
---|---|---|---|---|
7 nm TSMC | GA100 | 54,2 Milliards | 826 mm² | 65,6 |
7 nm TSMC | Navi 21 | 26,8 Milliards | 520 mm² | 51,6 |
8 nm Samsung | GA102 | 28,3 | 628 mm² | 45 |
8 nm Samsung | GA104 | 17,4 | 392 mm² | 44,3 |
7 nm TSMC | Navi 10 | 10,3 Milliards | 251 mm² | 41 |
7 nm TSMC | Vega 20 | 13.2 Milliards | 331 mm² | 39.9 |
16 nm TSMC | GP102 | 12 Milliards | 471 mm² | 25,5 |
14 nm GF | Vega 10 | 12,5 Milliards | 495 mm² | 25,3 |
16 nm TSMC | GP100 | 15,3 Milliards | 610 mm² | 25.1 |
12 nm TSMC | TU102 | 18,6 Milliards | 754 mm² | 24,7 |
12 nm TSMC | TU100 | 21,1 Milliards | 815 mm² | 24,3 |
D'après les chiffres communiqués, la densité de Navi 21 serait légèrement supérieure à celle de GA102 gravée en 8 nm (node 10 nm optimisé) par Samsung, mais bien moindre que celle de GA100, utilisant lui le 7 nm de TSMC. Toutefois, ces GPU ne visant pas du tout les mêmes usages, cela a pour conséquence des designs bien différents (cache L2 bien plus important sur GA100, probablement pas de moteur d'affichage intégré, etc.) qui peuvent impacter significativement la densité. Les versions du 7 nm sont peut-être différente également. On remarquera toute de même le gain à ce niveau de Navi 21 par rapport à Navi 10 ou Vega 20, utilisant pourtant eux-aussi le même nœud de TSMC. Voilà qui ajoute encore de l'incertitude quant à la version du 7 nm utilisée, même si là aussi, le design de la puce peut expliquer cette différence de densité (en particulier avec l'adjonction de la grosse quantité de cache).
Trois cartes graphiques sont déclinées depuis ce GPU, selon le niveau d'activation des unités, permettant donc de segmenter l'offre tout en réduisant les coûts de production en recyclant des puces "imparfaites".
NAVI 21 | RX 6900 XT | RX 6800 XT | RX 6800 |
---|---|---|---|
Shader Engine | 4 | 4 | 3 |
CU | 80 / 80 | 72 / 80 | 60 / 80 |
SP | 5120 | 4608 | 3840 |
TMU | 320 | 288 | 240 |
Ray Accelerator | 80 | 72 | 60 |
ROP | 128 | 128 | 96 |
Cache L2 (Mo) | 4 | 4 | 4 |
Infinity Cache (Mo) | 128 | 128 | 128 |
Bus mémoire (bits) | 256 | 256 | 256 |
Ainsi, la RX 6900 XT utilisera la version intégrale de Navi 21, alors que la RTX 3090 par exemple, utilise une puce partiellement bridée (2 SM désactivé soit 98% du total tout de même). Plus bas dans la gamme, la RX 6800 XT emploie une puce avec 90% des unités activées et un bus mémoire intégral, soit significativement plus que la RTX 3080 FE en comparaison (81% des unités de calculs actives et 83% du bus mémoire). Enfin, la RX 6800 voit de son côté la désactivation d'un Shader Engine, soit 25% de la puissance de calcul, texturing, rastérisation et géométrie. Elle conserve par contre un bus mémoire inchangé, tout comme le cache l'accompagnant (L2 et Infinity Cache). Elle n'a pas vraiment d'équivalent du côté vert, puisque la 3070 utilise un GPU plus bas de gamme, peut-être une future 3070 Ti, qui sait ?
Jetons à présent un coup d'œil à la macro organisation du GPU. Cette dernière est relativement similaire à ce que l'on retrouve pour Navi 10.
Un processeur de commande central est chargé de planifier et ordonner les différents threads. A ses côtés, se trouvent les unités chargées de l'organisation et de la gestion des tâches Compute, ainsi qu'un processeur géométrique central. Tout ceci est complété par diverses interfaces et moteurs de gestion (vidéo, encodage/décodage). La hiérarchie des caches évolue comme nous l'avons vue page précédente, puisqu'en sus des 4 Mo de L2 centralisés, on retrouve le niveau supplémentaire appelé Infinity Cache par le marketing d'AMD et comprenant pas moins de 128 Mo, par le biais de 2 partitions en liaison directe avec les contrôleurs mémoire.
Enfin, l'exécution des programmes est réalisée au sein de 4 Shaders Engine, chacun disposant de leurs propres cache L1, unité de rastérisation (découpe des triangles en pixels), Primitive Unit (génération et traitement des triangles), ainsi que 32 ROP (unité de rendu/sortie) et 10 WGP ou Dual Compute Unit, comprenant comme leur nom l'indique, 2 CU. Ces deux derniers éléments voient leur nombre doublé par rapport à Navi 10.
Ces évolutions conduisent à une progression sensible de la performance par cycle, tout en réduisant la consommation nécessaire à chacun de ces derniers. En couplant cela avec l'augmentation de fréquence, on obtient une puce non seulement bien plus performante, mais aussi plus efficace énergétiquement.
On peut donc schématiser Navi 21, comme étant un Navi 10 élargi au niveau du nombre de ses unités de calcul et auquel on aurait greffé un cache L3 (Infinity Cache), tout en augmentant sensiblement sa fréquence de fonctionnement.
AMD indique également avoir travaillé l'efficacité énergétique de sa carte durant les phases de repos. Ainsi, la consommation lorsque le moniteur est éteint, serait réduite de près de moitié par rapport à Navi 21. Pas de trace par contre d'une quelconque amélioration de la consommation au repos avec plus d'un écran, un point décevant du côté de Navi 10. Nous vous renvoyons à la page consommation, pour voir ce qu'il en est des nouvelles venues à ce niveau.
Abordons à présent le point qui a surpris de nombreuses personnes lors de son annonce par AMD, à savoir savoir le Smart Access Memory, à traduire par accès mémoire intelligent, une désignation bien marketing s'il en est. De quoi s'agit-il en réalité ? En fait, de l'activation d'une fonctionnalité de la norme PCIe, standardisée depuis des années par le consortium PCI-SIG, mais non utilisée par les GPU jusqu'à présent : le Resizable BAR (Base Adress Register). A l'origine, l'adressage mémoire 32-bit étant limitant, seuls 256 Mo de mémoire vidéo étaient accessibles simultanément par le CPU. Malgré le passage à l'ère 64-bit, ce mode de fonctionnement a été conservé (probablement par habitude), puisque des solutions pour le contourner existaient. AMD a toutefois vu ici une source de gains potentiels, en utilisant ce Resizable BAR, libérant l'accès à l'intégralité de la mémoire vidéo pour le processeur, sans avoir à jongler par tranche de 256 Mo.
C'est donc une bonne idée et compatible théoriquement avec de nombreuses configurations, puisqu'il suffit normalement d'avoir une configuration UEFI fonctionnant en mode "natif". Cela implique toutefois de désactiver CSM (Compatibility Support Module), qui permet d'émuler un "fonctionnement BIOS" pour booter avec des périphériques plus anciens et une table de partitionnement MBR (Master Boot Record), au lieu du plus récent et sécurisé GPT (GUI Partition Table). Seulement, AMD indique que son Smart Access Memory ne fonctionne que sur plateforme avec chipsets série 500 et processeurs série 5000, soit la dernière génération. Rien ne justifie à priori une telle segmentation, et Nvidia vient d'apporter de l'eau au moulin, en indiquant travailler sur une mise à jour de ses pilotes, qui proposeront la prise en charge du Resizable BAR pour des des gains du même ordre, mais surtout beaucoup moins restrictifs en termes de plateformes supportée. Wait & see donc, si l'assertion des verts s'avère véridique, AMD sera probablement contraint de se montrer plus ouvert lui aussi. Finissons notre tour d'horizon, par les capacités multimédia de ce nouveau GPU.
VP9 | H.264 | H.265 |
AV1 | |
---|---|---|---|---|
Decodage |
4K90 8K24 |
1080P600 4K150 |
1080P360 4K90 8K24 |
8K30 |
Encodage | - |
1080P360 4K90 |
1080P360 4K60 |
- |
On notera principalement l'ajout du décodage matériel pour le codec AV1, jusqu'à 8K en 30 i/s. Pas de mention par contre (AMD a été très peu loquace sur cette partie) d'une éventuelle prise en charge de l'encodage H.265 B Frame, un des avantages de l'encodeur du caméléon, en sus de la qualité de sortie. AMD ne précise pas d'amélioration à ce niveau, il faudra donc vérifier tout cela en pratique. Côté moteur d'affichage vidéo, à l'instar des cartes Ampere, Navi 21 gère les normes DP 1.4a avec DSC, ainsi que l'HDMI 2.1. Ce dernier permet l'affichage jusqu'en 8K en 60 Hz et 4K 144 Hz. Voilà c'est terminé pour cette partie, passons à la description des cartes de test à présent.
|