Test • Vega vs Pascal, 10 mois plus tard... |
————— 21 Juin 2018
Test • Vega vs Pascal, 10 mois plus tard... |
————— 21 Juin 2018
Commençons ce nouveau dossier par un récapitulatif d'un certain nombre de cartes haut de gamme des générations actuelles et passées. Celles qui nous intéressent aujourd'hui s'appuient sur 3 GPU : les GP102 / GP104 pour NVIDIA et Vega 10 du côté d'AMD.
Cartes | GPU | Fréquence Boost GPU (MHz) | Fréquence Mémoire (MHz) | Unités de calcul | TMU | ROP | Taille mémoire (Go) | Bus mémoire (bits) | Calcul SP (Gflops) | Bande Passante (Go/s) |
---|---|---|---|---|---|---|---|---|---|---|
HD 7970 GHz | Tahiti | 1050 | 1500 | 2048 | 128 | 32 | 3 | 384 | 4301 | 288 |
R9 290X | Hawaii | 1000 | 1250 | 2816 | 176 | 64 | 4 | 512 | 5632 | 320 |
R9 390 | Hawaii | 1000 | 1500 | 2560 | 160 | 64 | 8 | 512 | 5120 | 384 |
R9 390X | Hawaii | 1050 | 1500 | 2816 | 176 | 64 | 8 | 512 | 5914 | 384 |
R9 Fury | Fiji | 1000 | 500 | 3584 | 224 | 64 | 4 | 4096 | 7168 | 512 |
R9 Fury X | Fiji | 1050 | 500 | 4096 | 256 | 64 | 4 | 4096 | 8602 | 512 |
RX VEGA56 | Vega 10 | 1471 | 800 | 3584 | 224 | 64 | 8 | 2048 | 10544 | 410 |
RX VEGA64 | Vega 10 | 1546 | 945 | 4096 | 256 | 64 | 8 | 2048 | 12665 | 484 |
GTX 680 | GK104 | 1058 | 1502 | 1536 | 128 | 32 | 2 | 256 | 3250 | 192 |
GTX 780 | GK110 | 902 | 1502 | 2304 | 192 | 48 | 3 | 384 | 4156 | 288 |
GTX 780 Ti | GK110 | 928 | 1750 | 2880 | 240 | 48 | 3 | 384 | 5345 | 336 |
GTX 970 | GM204 | 1176 | 1753 | 1664 | 104 | 56 | 4 |
224 |
3920 | 196 |
GTX 980 | GM204 | 1216 | 1753 | 2048 | 128 | 64 | 4 | 256 | 4981 | 224 |
GTX 980 Ti | GM200 | 1075 | 1753 | 2816 | 176 | 96 | 6 | 384 | 6054 | 337 |
GTX TITAN X | GM200 | 1075 | 1753 | 3072 | 192 | 96 | 12 | 384 | 6605 | 337 |
GTX 1070 | GP104 | 1683 | 2003 | 1920 | 120 | 64 | 8 | 256 | 6463 | 256 |
GTX 1070 Ti | GP104 | 1683 | 2003 | 2432 | 152 | 64 | 8 | 256 | 8186 | 256 |
GTX 1080 | GP104 | 1733 | 1251 | 2560 | 160 | 64 | 8 | 256 | 8873 | 320 |
GTX 1080 Ti | GP102 | 1582 | 1376 | 3584 | 224 | 88 | 11 | 352 | 11340 | 484 |
TITAN X | GP102 | 1531 | 1251 | 3584 | 224 | 96 | 12 | 384 | 10974 | 480 |
TITAN Xp | GP102 | 1582 | 1426 | 3840 | 240 | 96 | 12 | 384 |
12150 |
548 |
TITAN V | GV100 | 1455 | 850 | 5120 | 320 | 96 | 12 | 3072 | 14899 | 653 |
Chez les verts, les GTX 1070, 1070 Ti et 1080 utilisent un GP104, une puce de taille moyenne (314 mm²) gravée en 16 nm FinFET par TSMC. Elle s'appuie sur 4 GPC (Graphics Processor Cluster), de grosses structures multifonctions reliées à 16 ROP (Render Output Unit), soit 64 en tout. Celles-ci sont interconnectés par groupe de 8, à un contrôleur mémoire 32-bit (bus 256-bit au total) et une portion (256 Ko) du cache L2 centralisé (2 Mo). Chaque GPC comprend en sus du moteur de rastérisation, 5 TPC (Texture Processor Cluster), eux-mêmes constitués d'un Polymorph Engine (unités géométriques) et d'un SM (Streaming Multiprocessor).
Ce dernier, base des architectures récentes du caméléon, est principalement constitué de 128 unités de calcul (32-bit) et 8 TMU (Texture Mapping Unit), portant leur nombre total au sein du GPU à 2560/160. NVIDIA associe au GP104 de la GDDR5 ou GDDR5X (GTX 1080). Cette dernière est également la seule à disposer d'une puce pleinement fonctionnelle (20 TPC/SM), les 2 autres voyant la désactivation d'un (1070 Ti) ou plusieurs (1070) SM. Enfin, les fréquences officielles sont particulièrement élevées par défaut et souvent amplement dépassées en pratique (gestion via GPU Boost 3.0).
Les GTX 1080 Ti et Titan X (2016) / Xp utilisent de leur côté une puce GP102 plus imposante à 471 mm², et toujours gravée par TSMC en 16 nm FinFET. Les différents éléments constitutifs du GPU progressent pour la plupart de 50% par rapport au GP104, avec 6 GPC, 30 TPC/SM, 3 Mo de L2, 3840 unités de calcul, 240 TMU et 96 ROP pour une puce intégrale. Le bus mémoire suit bien-sûr la même inflation à 384-bit sur les Titan, un contrôleur 32-bit étant toutefois désactivé sur la 1080 Ti (352-bit). Les 3 cartes utilisent par contre systématiquement de la GDDR5X, mais à des fréquences officielles différentes.
De leur côté, les 2 cartes d'AMD s'appuient sur le seul et unique Vega 10, gravé par Global Foundries via son process 14 nm, FinFET lui-aussi, pour une superficie légèrement supérieure au GP102, à 486 mm². Utilisation de mémoire HBM 2 oblige, il est raccordé via un interposer (au sein du même packaging), à 2 piles (stack) de 4 Go interfacées (chacune) en 1024-bit, créant ainsi un bus mémoire d'une largeur de 2048-bit. Le GPU s'appuie comme ses devanciers sur 4 pipelines graphiques, avec en tête de ce dernier, une grosse unité géométrique suivie du moteur de rastérisation (DSBR) de dernière génération, prenant en charge (à l'instar du concurrent) le Tile Rendering. Ensuite, la partie calcul est assurée par un total de 64 (New) Compute Unit (CU), comprenant chacune 4 TMU et 64 unités de calcul 32-bit, compatibles avec la 1/2 précision (16-bit) à double vitesse. Enfin, 64 ROP sont chargées d'écrire en mémoire via un cache L2 centralisé de 4 Mo.
Voici résumées très succinctement, les différentes caractéristiques de nos protagonistes du jour. Si l'on s'attache aux chiffres, on peut penser sur le papier que les RX Vega sont équipées pour lutter avec les cartes s'appuyant sur GP102. C'est partiellement exact, tout du moins concernant les valeur brutes de bande passante mémoire, texturing et puissance de calcul. Mais comme toujours, les comparaisons à ce niveau sont à prendre avec beaucoup de précautions du fait d'une différence importante de conception architecturale (les GeFORCE disposent par exemple d'unités SFU chargées des opérations complexes, alors que ce sont les unités de calcul classiques qui s'en occupent sur les RADEON) et donc d'efficience, modulant donc largement ces données brutes.
Qui plus est, les fréquences réellement appliquées sont déterminantes, et l'avantage à ce niveau est plutôt du côté vert, tout comme l'est le fillrate et le traitement de la géométrie. Les performances ludiques d'un GPU sont le fruit d'un savant équilibre entre ses composantes et le besoin des moteurs 3D, c'est pourquoi on peut disposer de gros chiffres sur le papier, mais pas forcément les traduire en pratique par des résultats probants en jeu. C'est le cas de Vega 10, AMD a donc tenté de positionner financièrement les cartes gaming utilisant ce dernier en face des cartes GP104, affichant un niveau de performance ludique similaire, plutôt que celles à base de GP102. Ce n'est bien entendu pas si facile, puisque l'on peut sans risque estimer (vu la taille de la puce et l'utilisation d'HBM impliquant un interposer) que le coût de production de Vega 10 est bien plus adapté au segment du GP102 qu'à celui de son petit frère...
Nous utilisons la suite de tests Geeks 3D et débutons avec PixMark Julia FP32, qui permet de mesurer le débit de pixels en simple précision. Ce test est relativement bref et permet donc aux modèles de référence de conserver des fréquences élevées durant son exécution. On constate sans peine que le Flagship des rouges, s'il arrive à prendre un très léger ascendant sur la GTX 1080 Founders Edition, reste dans les "mêmes eaux" que cette dernière et ne peut donc absolument pas lutter à ce niveau, avec les cartes s'appuyant sur GP102. L'explication est à chercher du côté des 96 unités de rendu (ROP) de ce dernier, contre 64 aux Vega.
Poursuivons avec le test GiMark, qui mesure les performances de nos cartes sur une scène très chargée au niveau de la géométrie. A nouveau Vega 10 et GP104 jouent des coudes, alors que GP102 est intouchable. Point intéressant, la TITAN Xp devance cette fois très nettement la GTX 1080 Ti, pourtant l'écart de caractéristiques n'explique pas un tel delta. L'explication est à chercher du côté des pilotes : le caméléon bride les performances absolues de sa gamme grand public dans le domaine géométrique, pour privilégier ses Quadro et éviter une concurrence interne sur le marché pro. Toutefois, depuis le lancement de la VEGA Frontier Edition qui chasse sur les mêmes terres, le caméléon a décidé de réactiver dans ses pilotes pour TITAN, certaines optimisations et fait disparaître quelques restrictions appliquées aux GeFORCE.
Terminons cette séquence tests synthétiques, par le traitement de la Tesselation. Cette fois, Vega 10 peine à accrocher GP104 castré. Les multiples unités géométriques traitant (entre autres choses) la Tesselation étant incluses au sein des TPC (structure interne incluant les SM) sur les GeFORCE récentes, leur multiplication évite l'engorgement qui peut survenir avec de grosses unités centralisées et moins nombreuses (telles celles de Vega 10), lorsque les facteurs de Tesselation sont élevés comme ici (64x). L'écart entre 1080 Ti et Titan Xp s'explique de la même façon que pour le test précédent.
C'est tout pour cette partie, voyons page suivante le protocole de test.
|
Un poil avant ?SF Platinum et Vengeance : deux nouvelles séries d'alimentations chez Corsair | Un peu plus tard ...Live Twitch • The Crew 2, la bêta |