Test • GeFORCE GTX 1080 Ti |
————— 09 Mars 2017
Test • GeFORCE GTX 1080 Ti |
————— 09 Mars 2017
Avant de décrire la carte que nous a fait parvenir NVIDIA, passons en revue les principales caractéristiques de son GPU aka GP102. Ce dernier fait partie de ce que l'on pourrait appeler les "grosses puces" avec pas moins de 471 mm², même si on reste relativement éloigné des records à ce niveau, comme le GP100 et ses 610 mm². Mais revenons à la star du jour qui concentre pas moins de 12 milliards de transistors au sein de son die. C'est TSMC qui a été choisi pour graver la puce via son 16 nm déjà usité sur les GP100/104/106. La taille est donc en hausse de 50 % par rapport à GP104 et le nombre de transistors est encore plus impressionnant avec +66 % vis-à-vis de la même référence. C'est bien entendu l’architecture Pascal qui est à la manœuvre, pour les détails concernant cette dernière, nous vous invitons à lire ou relire la page qui lui est dédiée dans le dossier GTX 1070/1080. Commençons par le diagramme du GPU :
Diagramme logique du GP102-350
GP102 se compose de 6 GPC (Graphics Processing Cluster) qui comprennent en leur sein un Raster Engine chargé de transformer les triangles en pixels (16 par cycle) et 6 TPC (Texture Processing Cluster). Ces derniers sont constitués d'un Polymorph Engine dédié à la géométrie, ainsi qu'un SM (Streaming Multiprocessor) incluant 128 unités de calcul SP (également 4 DP n'apparaissant pas sur le schéma), 8 unités de texturing et du cache. La version 350 de GP102 implique la désactivation de 2 TPC, ce qui porte leur nombre à 28 en tout, à l'instar de la puce utilisée pour la TITAN X. Notons que schématiquement, les TPC sont désactivés dans des GPC différents, mais il n'est pas impossible qu'ils le soient au sein d'un même GPC, réduisant ainsi le débit de calcul à 12 pixels/cycle, soit moins que le Rasterizer.
Pour autant, ces deux GP102 ne sont pas tout à fait identiques : NVIDIA a décidé de retenir une configuration légèrement bridée au niveau de l'interface mémoire (augmentant probablement les Yields), en désactivant un contrôleur mémoire 32-bit (et les 8 ROP / 256 Ko L2 liés) sur les 12 constituant le bus mémoire à 384-bit d'un GP102 intégral. Il ne reste donc "que" 352-bit actifs et le caméléon a décidé de ne pas se lancer dans un bus tarabiscoté à la GTX 970 pour conserver une quantité de mémoire paire, mais a tout simplement supprimé une puce mémoire portant ainsi la capacité totale à 11 Go contre 12 à la TITAN X, une solution assurément plus "propre" et qui évitera toute polémique sur le sujet. Pour maintenir la bande passante, le caméléon a opté pour des puces plus rapides à 11 Gbps.
NVIDIA indique avoir particulièrement travaillé son contrôleur mémoire au sein des générations Maxwell/Pascal pour autoriser des fréquences très élevées, mais il a aussi collaboré étroitement avec les fabricants de mémoires sur la qualité du signal d'horloge, en particulier la zone critique de changement d'état ("l’œil" entre les courbes sinusoïdales), afin de limiter au maximum le bruit et la gigue nuisant aux fréquences très élevées, comme en témoigne la capture précédente. Pour rappel, des algorithmes de compression couleur (Delta Color) très évolués, permettent également de réduire la quantité de données à transférer, augmentant de fait le débit effectif. Enfin, le Tiled Caching permet lui aussi de limiter les accès mémoires en ne rasterisant que les triangles visibles, ceci via l'utilisation du cache L2 et d'une unité dédiée (binner).
Du côté des fonctionnalités, on retrouve les mêmes éléments que pour GP104. Ainsi, au niveau de la prise en charge DX12, pas de nouveautés (niveau de fonctionnalités 12_1 / Tier 2) par rapport à Maxwell. Le moteur vidéo permet toujours 4 écrans simultanés et supporte les normes HDMI 2.0B et DP 1.3/1.4 pour le HDR entre autres choses. Côté décodage/encodage, on conserve les capacités du GP104. Poursuivons par le SMP (Simultaneous Multi-Projection), GPU Boost 3.0 et Fast Sync qui répondent toujours présents à l'instar des autres puces de cette génération. Enfin, un mot rapide sur les instructions DP2A et DP4A dédiées au Deep Learning et permettant d'accélérer par 2 et 4 les opérations à faible précision (16 et 8 bits). Voilà pour un bref tour d'horizon de ce GPU, passons aux caractéristiques de la seconde carte l'abritant, en comparaison d'autres références haut de gamme, présentes ou passées.
Cartes | GPU | Fréquence GPU (MHz) | Fréquence Mémoire (MHz) | Unités de calcul | TMU | ROP | Taille mémoire (Go) | Bus mémoire (bits) | Calcul SP (Gflops) | Bande Passante (Go/s) |
---|---|---|---|---|---|---|---|---|---|---|
HD 7970 GHz | Tahiti | 1050 | 1500 | 2048 | 128 | 32 | 3 | 384 | 4301 | 288 |
HD 7990 | Tahiti (x2) | 950 à 1000 | 1500 | 2048 (x2) | 128 (x2) | 32 (x2) | 3 (x2) | 384 (x2) | 7782 à 8192 | 576 |
R9 295 X2 | Hawaii (x2) | 1018 | 1250 | 2816 (x2) | 176 (x2) | 64 (x2) | 4 (x2) | 512 (x2) | 11467 | 640 |
R9 390X | Hawaii | 1050 | 1500 | 2816 | 176 | 64 | 8 | 512 | 5914 | 384 |
R9 Fury X | Fiji | 1050 | 500 | 4096 | 256 | 64 | 4 | 4096 | 8602 | 512 |
RADEON PRO DUO | Fiji (x2) | 1000 | 500 | 4096 (x2) | 256 (x2) | 64 (x2) | 4 (x2) | 4096 (x2) | 16384 | 1024 |
GTX 780 Ti | GK 110 | 876 à 928 | 1750 | 2880 | 240 | 48 | 3 | 384 | 5045 à 5345 | 336 |
TITAN | GK110 | 837 à 876 | 1502 | 2688 | 224 | 48 | 6 | 384 | 4500 à 4709 | 288 |
TITAN Black | GK110 | 889 à 980 | 1750 | 2880 | 240 | 48 | 6 | 384 | 5121 à 5645 | 336 |
TITAN Z | GK110 (x2) | 705 à 876 | 1750 | 2880 (x2) | 240 (x2) | 48 (x2) | 6 (x2) | 384 (x2) | 8122 à 10092 | 672 |
GTX 980 Ti | GM200 | 1000 à 1075 | 1753 | 2816 | 176 | 96 | 6 | 384 | 5632 à 6054 | 337 |
TITAN X | GM200 | 1000 à 1075 | 1753 | 3072 | 192 | 96 | 12 | 384 | 6144 à 6605 | 337 |
GTX 1080 | GP104 | 1607 à 1733 | 1251 | 2560 | 160 | 64 | 8 | 256 | 8228 à 8873 | 320 |
GTX 1080 Ti | GP102 | 1480 à 1582 | 1376 | 3584 | 224 | 88 | 11 | 352 | 10609 à 11340 | 484 |
TITAN X | GP102 | 1417 à 1531 | 1251 | 3840 | 224 | 96 | 12 | 384 | 10157 à 10974 | 480 |
La GTX 1080 Ti devance la TITAN X (2016) de 3,3 % au niveau de la puissance de calcul en se basant sur les boost respectifs annoncés. Toutefois, cette valeur est très fluctuante suivant la capacité de refroidissement et la consommation, nous vérifierons donc ce point page 16. Il en est de même pour le texturing, quant à la bande passante mémoire, elle est en hausse de 0,8 %, soit un écart négligeable. Côté Fillrate, selon la configuration des deux GP102, à savoir la désactivation des 2 TPC au sein du même GPC ou non, la TITAN X pourra prendre ou non, un léger avantage du fait de ses 96 ROP actifs contre 88 à la GTX 1080 Ti.
Si on s'attache uniquement aux chiffres bruts, la Fury X du concurrent agée de 20 mois n'est devancée "que" de 32 % en puissance de calcul et conserve un ascendant de 6,66 % pour la bande passante mémoire. Elle affiche par contre de lourds déficits en géométrie et fillrate, sans compter que n'apparaît pas dans les chiffres de calcul SP, l'apport des unités SFU des GeFORCE. Passons page suivante à la description de la carte.
|
Un poil avant ?Second test pour les fantômes en reconnaissance dans les terres sauvages | Un peu plus tard ...Une GTX 1080Ti AORUS Xtreme en arrivage |