Test • AMD RADEON VII |
————— 07 Février 2019
Test • AMD RADEON VII |
————— 07 Février 2019
Pour ceux intéressés par l'architecture Vega, nous vous invitons à lire ou relire la page que nous lui avions consacrée lors du dossier dédié à la RX Vega64. Résumée en quelques lignes, cette dernière s'appuie toujours sur GCN (Graphics Core Next) intronisé avec les Radeon HD 7900, même si AMD a fait disparaître toute référence à cette dénomination pour l'architecture. On peut toutefois considérer Vega comme étant la 5ème itération de GCN, avec des évolutions au niveau des unités de calculs supportant à présent la 1/2 précision (FP16) à double vitesse.
Les unités de rastérisation progressent également en adoptant le DSBR (Draw Stream Bining Rasterizer), pouvant générer des gains opportunistes via Tiled Rendering. Le cache L2 centralisé est également doublé, et diverses optimisations sont apportées pour la géométrie (Primitive Shader) ou l'IA (instructions spécifiques au Deep Learning). Enfin, un grand nombre de transistors a été dédié pour permettre de monter davantage en fréquence (redondance du signal, contrôle et correction d'erreurs, etc.). Voilà pour l'architecture, en tout cas celle déclinée dans le seul GPU dédié disponible, alias Vega 10.
Il a été rejoint en fin d'année dernière par Vega 20, un GPU très proche mais qui diffère toutefois en quelques points. AMD ne nous ayant pas communiqué de diagramme de cette nouvelle puce, nous avons modifié celui fourni lors du lancement de la Vega64. La principale nouveauté est l'utilisation de 4 piles HBM 2 au lieu de 2 sur la précédente déclinaison. Cette modification a un impact notable concernant la bande passante mémoire, puisque le bus passe de 2048-bit à 4096-bit ! Par contre, les unités de rendu (ROP) restent inchangées à 64, une valeur n'ayant plus évolué depuis Hawaii.
Diagramme simulé de Vega 20
Toujours au niveau des différences séparant Vega 20 de son prédécesseur, les unités de calcul évoluent également. En effet, en sus des demi-précision (FP16 à double vitesse) et simple précision (FP32), elles sont à présent capables de réaliser la double précision (FP64) avec un ratio d'1/2 par rapport à la SP. Cette fonctionnalité n'a aucun intérêt d'un point de vue ludique, mais les professionnels pourront y trouver une utilité pour certaines tâches. Ceux y voyant une opportunité d'économie à ce niveau, par rapport à une coûteuse MI50/60 devront vite déchanter, les pilotes limitant le débit en FP64 à une valeur inférieure sur cette Radeon VII.
Détails des unités de calcul de Vega 20
Finissons avec quelques ajouts complémentaires. Le premier est la prise en charge du PCIe 4.0 au sein de la puce, toutefois, AMD limite cette Radeon VII à la norme 3.0. Compte-tenu de l'absence de plateforme grand public compatible, cette décision est à nouveau on ne peut plus logique. Ensuite, le concepteur explique avoir amélioré certaines latences et quelques points limitant précédemment la montée en fréquence. Il profite probablement pour cela, des performances en hausse des transistors, nous y reviendrons un peu plus bas. Enfin, les rouges communiquent sur la présence de 64 points de mesure de la température (sans compter ceux liés à la HBM 2) du die, soit deux fois plus que sur Vega 10. De ce fait, AMD dispose d'un réseau de mesure très précis, lui permettant d'affiner au plus près la température maximale admissible et réguler en conséquence plus finement la ventilation. Cette température maximale mesurée au sein des 64 points est appelée Temperature Junction, elle devrait correspondre au Hot Spot qui était reporté par GPU-Z sur les précédentes Vega. La valeur température GPU correspond quant à elle généralement à celle mesurée sur les bords (Edge) selon AMD.
Localisation des sondes de température sur le die
Mais la grosse nouveauté de Vega 20 n'est pas à chercher du côté de l'architecture ou des fonctionnalités, mais bien du process de fabrication retenu. C'est en effet le premier GPU dédié aux cartes graphiques, à être gravé en 7 nm par l'entremise de TSMC. Ce Node était pour le moment réservé aux puces dévolues à la mobilité, AMD a choisi une adoption plutôt précoce pour une puce haut de gamme, alors qu'il se contente par exemple du 12 nm pour le Polaris 30 de la RX 590 qui a été commercialisée 3 mois plus tôt, et que son concurrent fait de même pour Turing.
Cela constitue donc une prise de risques, mais cette dernière lui donne un avantage conséquent en termes de performance des transistors et densité, pour peu que la production suive. C'est probablement pour cela que les rouges se limitent pour le moment au haut de gamme, nécessitant des volumes de production bien moindre (malgré cela, il subsiste des doutes sur le niveau réel de disponibilité). Le gain en densité a permis de faire tenir sur un interposer de taille similaire, le GPU et 4 piles HBM 2, alors qu'il fallait se contenter de 2 avec le précédent GPU 14 nm !
Ce n'est pas anodin, la fabrication d'interposers de grandes tailles nécessite une production par multi-exposition bien plus coûteuse et donc difficile à rentabiliser, surtout dans le cadre d'une carte grand public. Les puces HBM 2 produites en masse étant à minima d'une capacité de 4 Go, Vega 20 ne peut donc embarquer moins de 16 Go, tout du moins pour converser la bande passante mémoire de 1 To/s permise par une telle configuration à 4 piles.
L'effet de la densité accrue du 7 nm sur la taille du die
Puisque l'on parle densité, quid du résultat obtenu ? En s'appuyant sur les chiffres communiqués par AMD, le passage à ce nouveau Node permet d'améliorer la densité de 58%, de quoi réduire drastiquement la taille des dies, ou utiliser cette densité pour complexifier davantage les GPU. A noter qu'AMD communiquait précédemment sur une taille de 486 mm² concernant le die de Vega 10, ce dernier passe à présent à 495 mm². Par quelle magie ? En fait, les rouges communiquent à présent deux valeurs distinctes pour les die des Vega56 (486 mm²) et Vega64 (495 mm²), ce qui n'a pas de sens puisque la surface à graver reste identique, que l'on se serve ou non des "parties inactives". Il s'agissait probablement de communiquer précédemment sur une valeur inférieure, afin de rassurer les investisseurs quant aux coûts de production de Vega 10... Toujours est-il qu'en anticipant l'adoption de ce Node 7 nm, AMD prend au niveau de la densité en transistors, un avantage considérable sur son concurrent.
Cartes | GPU | Nombre de transistors | Superficie Die |
Densité (Millions de transistors / mm²) | Procédé de fabrication |
---|---|---|---|---|---|
Radeon VII | Vega 20 | 13,2 Milliards | 331 mm² | 39,9 | TSMC 7 nm FF |
Radeon RX Vega56/64 | Vega 10 | 12,5 Milliards | 495 mm² | 25,3 | GF 14 nm LPP |
GeForce RTX 2080 Ti | TU102 | 18,6 Milliards | 754 mm² | 24,7 | TSMC 12 nm FFN |
GeForce RTX 2080 | TU104 | 13,6 Milliards | 545 mm² | 24,9 | TSMC 12 nm FFN |
GeForce RTX 2070/60 | TU106 | 10,8 Milliards | 445 mm² | 24,3 | TSMC 12 nm FFN |
GeForce GTX 1080 Ti | GP102 | 12 Milliards | 471 mm² | 25,5 | TSMC 16 nm FF+ |
GeForce GTX 1080/70 (Ti) | GP104 | 7,2 Milliards | 314 mm² | 22,9 | TSMC 16 nm FF+ |
L'avantage ne s'arrête pas là, puisque les performances desdits transistors progressent également significativement. Ainsi, AMD indique concernant ce process 7 nm, qui sera également utilisé pour ses futurs Ryzen 3000, qu'il est possible d'augmenter les performances de 25% pour la même consommation ou choisir de réduire cette dernière de 50% à ISO fréquence. Quelles conséquences pratiques pour Vega 20 ? Là où la RX Vega64 dispose d'un boost typique annoncé à 1547 MHz, la valeur attendue pour la Radeon VII est de 1750 MHz, soit +13%.
Mais qui dit adoption précoce, dit bien souvent coûts de production élevés du fait du prix facturé par le fondeur pour son process le plus évolué, mais aussi des Yields (taux de puces fonctionnelles par Wafer) peu reluisants au départ. C'est pourquoi AMD a été contraint d'améliorer le nombre de puces utilisables sur son nouveau haut de gamme, en désactivant certaines unités afin de permettre un recyclage de celles partiellement défectueuses. NVIDIA ne pratique pas autrement pour sa dernière gamme. Voici en conséquence les compromis que les rouges ont dû se résoudre à appliquer.
RADEON VII | Quantité activée | Quantité Présente |
---|---|---|
"Shader Engine" | 4 | 4 |
CU | 60 | 64 |
ALU | 3840 | 4096 |
TMU | 240 | 256 |
ROP | 64 | 64 |
L2 (Mo) | 4 | 4 |
Bus mémoire (bits) | 4096 | 4096 |
Pas de quoi fouetter un canard chat, puisque seuls 6% des unités de calcul et texturing se voient désactivées. Ce choix doit probablement permettre à AMD de commercialiser sans perte sa nouvelle carte via ce recyclage, tout en tirant pratiquement le maximum du potentiel de sa puce (la bande passante n'étant pas impactée, l'écart moyen mesuré en jeu sera inférieur à 6%). Voilà pour Vega 20, passons page suivante à la description de la RADEON VII.
|
Un poil avant ?Le 7nm Intel, ça commencera en Oregon ! | Un peu plus tard ...TU116 déniché dans AIDA64 |