COMPTOIR
register

×

diagramme logique de GP102

Test • TITAN X (Pascal)
diagramme logique de GP102

• GP102

Avant de décrire la carte que nous a fait parvenir NVIDIA, passons en revue les principales caractéristiques de son nouveau GPU aka GP102. Ce dernier fait partie de ce que l'on pourrait appeler les "grosses puces" avec pas moins de 471 mm², même si on reste relativement éloigné des records à ce niveau, dont le GP100 et ses 610 mm². Mais revenons à la star du jour qui concentre pas moins de 12 Milliards de transistors au sein de son die. C'est TSMC qui a été choisi pour graver la puce via son 16 nm déjà usité sur les GP100/104/106. La taille est donc en hausse de 50% par rapport à GP104 et le nombre de transistors est encore plus impressionnant avec +66% vis-à-vis de la même référence. C'est bien entendu l’architecture Pascal qui est à la manœuvre, pour les détails concernant cette dernière, nous vous invitons à lire ou relire la page qui lui est dédiée dans le dossier GTX 1070/1080. Commençons par le diagramme du GPU :

 

diagramme logique de GP102 [cliquer pour agrandir]

Diagramme logique du GP102

 

La recette appliquée par NVIDIA pour concevoir sa puce "Enthusiast" à partir de celle dédiée au haut de gamme est la même que celle qui fut utilisée lors de la précédente génération : x 1,5 pour toutes les unités ! On passe donc de 4 GPC sur GP104 à 6 pour GP102, permettant ainsi la génération de 6 triangles par cycle d'horloge et 96 pixels en sortie des unités de rasterisation pour une puce complète. En descendant d'un niveau au sein de l'architecture, on retrouve bien entendu les TPC (5 par GPC) comprenant chacun 1 SM (Streaming Multiprocessor se chargeant des calculs, du texturing et disposant de mémoire partagée) et 1 Polymorph Engine dédié à la géométrie (dont la tesselation). On obtient donc 30 SM soit 3840 unités de calculs scalaires et 240 TMU pour un GP102 intégral.

 

Pour le bus mémoire, NVIDIA a appliqué le même régime en augmentant de 50% le nombre de contrôleurs 32-bit qui passent en conséquence à 12. Le nombre de ROP suit cet ajustement avec 96, tout comme le cache L2 progressant de 2 à 3 Mo. NVIDIA réemploie la GDDR5X en association avec ce GPU (très) haut de gamme et à l'instar de la GTX 1080, ce sont des puces certifiées pour 10 Gbps qui accompagnent ce GP102 sur la TITAN X. En conséquence, la bande passante va grimper de 50% du fait d'un bus total à 384-bit. Ajoutons que bien entendu, les algorithmes de compression sans perte des couleurs (Delta Color), en progrès avec Pascal, répondent présents et permettent d'optimiser la bande passante effective en comparaison de la génération Maxwell.

 

Du côté des fonctionnalités, on retrouve les mêmes éléments que pour GP104. Ainsi, au niveau de la prise en charge DX12, pas de nouveautés (niveau de fonctionnalités 12_1 / Tier 2) par rapport à Maxwell. Le moteur vidéo reste le même avec la prise en charge de 4 écrans simultanés et des normes HDMI 2.0B et DP 1.3/1.4 pour le HDR entre autres choses. Côté décodage/encodage, on conserve les capacités du GP104. Poursuivons par le SMP (Simultanous Multi-Projection), GPU Boost 3.0 et Fast Sync qui répondent toujours présents à l'instar des autres puces de cette génération. Enfin, un mot rapide sur les instructions DP2A et DP4A dédiées au Deep Learning et permettant d'accélérer par 2 et 4 les opérations à faible précision (16 et 8 bits).

 

Voilà pour ce bref tour d'horizon de ce nouveau GPU, passons aux caractéristiques de la première carte l'abritant en comparaison de quelques cartes haut de gammes présentes ou passées.

 

 

• Spécifications

 

CartesGPUFréquence GPU (MHz)Fréquence Mémoire (MHz)Unités de calculTMUROPTaille mémoire (Go)Bus mémoire (bits)Calcul SP (Gflops)Bande Passante (Go/s)
HD 7970 GHz Tahiti 1050 1500 2048 128 32 3 384 4301 288
HD 7990 Tahiti (x2) 950 à 1000 1500 2048 (x2) 128 (x2) 32 (x2) 3 (x2) 384 (x2) 7782 à 8192 576
R9 295 X2 Hawaii (x2) 1018 1250 2816 (x2) 176 (x2) 64 (x2) 4 (x2) 512 (x2) 11467 640
R9 390X Hawaii 1050 1500 2816 176 64 8 512 5914 384
R9 Fury X Fiji 1050 500 4096 256 64 4 4096 8602 512
RADEON PRO DUO Fiji (x2) 1000 500 4096 (x2) 256 (x2) 64 (x2) 4 (x2) 4096 (x2) 16384 1024
GTX 780 Ti GK 110 876 à 928 1750 2880 240 48 3 384 5045 à 5345 336
TITAN GK110 837 à 876 1502 2688 224 48 6 384 4500 à 4709 288
TITAN Black GK110 889 à 980 1750 2880 240 48 6 384 5121 à 5645 336
TITAN Z GK110 (x2) 705 à 876 1750 2880 (x2) 240 (x2) 48 (x2) 6 (x2) 384 (x2) 8122 à 10092 672
GTX 980 Ti GM200 1000 à 1075 1753 2816 176 96 6 384 5632 à 6054 337
TITAN X GM200 1000 à 1075 1753 3072 192 96 12 384 6144 à 6605 337
GTX 1080 GP104 1607 à 1733 1251 2560 160 64 8 256 8228 à 8873 320
TITAN X GP102 1417 à 1531  1251 3584 224 96 12 384 10157 à 10974  480

 

Vous avez peut-être remarqué que lors de notre description de GP102, nous avons souvent utilisé les termes "pour une puce complète" ou "un GPU intégral" : c'était à dessein puisque à l'instar de la TITAN première du nom, NVIDIA utilise ici une puce légèrement bridée pour faciliter sa production.

titanx2

 

En pratique, "seuls" 28 des 30 TPC sont activés sur la TITAN X 2016. Par voie de conséquence, le nombre d'unités de calcul passe de 3840 à 3584, les TMU de 240 à 224 et les Polymorph Engine de 30 à 28 soit, une baisse de 6,66%. Un petit détail à ajouter sur le sujet, si les 2 TPC désactivés le sont au sein d'un même GPC, le fillrate sera également impacté puisque limité à 92 pixels par cycle au lieu de 96. En effet, chaque GPC se voit "attribué" 2 partitions de 8 ROP, soit 16 pixels max par cycle en sortie. Mais faut-il encore les alimenter suffisamment : en temps normal, pas de souci puisque les 5 SM sont capables de calculer 20 pixels par cycle (4 pixels / SM). Un SM désactivé permet encore d'obtenir 16 pixels, soit le débit exact des ROP. Mais avec une seconde désactivation au sein du même GPC, ce dernier doit alors se contenter de 12 pixels, insuffisants pour saturer complétement les ROP, qui pourront tout de même s'avérer utiles lors de l'application de MSAA par exemple.

 

Si on parle gros chiffres cette fois, La TITAN X (2016) devance le modèle 2015 de 66% au niveau de la puissance de calcul et de texturing. La bande passante bondit de son côté de 42%, mais n'apparaissent pas derrière ces comparaisons les gains liés à l'architecture. Face à la GTX 1080, c'est cette fois plus serré puisque cette dernière profite d'une fréquence GPU plus élevée limitant ainsi à 24% le gain de la nouvelle venue, hormis pour la bande passante mémoire qui progresse bien de 50%. Si on s'attache uniquement aux chiffres bruts, la Fury X du concurrent tient encore la route sur le papier puisqu'elle n'est devancée que de 27% en puissance de calcul et conserve un ascendant de 6,66% pour la bande passante mémoire. Elle affiche par contre de lourds déficits en géométrie et fillrate, sans compter que n'apparaissent pas dans les chiffres de calcul SP l'apport des unités SFU des GeFORCE. Passons page suivante à la description de la carte.



Un poil avant ?

La R9 285X et Tonga seraient toujours d'actualité ?

Un peu plus tard ...

ROCCAT joue la surenchère avec son nouveau clavier pour joueur, le Suora FX

Les 38 ragots
Les ragots sont actuellement
ragots réservés aux QI élevésouverts aux ragoteurs logués
par Myloween, le Vendredi 11 Novembre 2016 à 12h55  
par Pitostreum le Vendredi 11 Novembre 2016 à 12h27
Ah, une dernière chose pour le shunt mod.
Je conseillerais d'éviter d'appliquer la "liquid metal" sur les 3 résistances car le risque est que la carte se mette en défaut et bloque à la fréquence 2D.
Certains l'ont fait sur les 3 mais avec une couche très mince.
De toute façon, la Titan XP étant limitée à 1.092v (vstock = 1.05 / 1.06), ça ne sert à rien de faire les 3 car avec 2, il y a largement assez de marge en TDP.
En principe, le faire sur une seule suffit avec la bonne quantité de liquid metal appliquée (ni trop, ni trop peu )
Merci beaucoup pour les précisions, ouai le voltage limite est vraiment bas comparé a ce qu'on pouvais faire avec un bios moddé sur les kepler.
Au final ici on ne peut jouer qu'avec le TDP si j'ai bien compris.
Sinon je suis bien limité par le TDP car sur Dishonored 2 je suis a 2088Mhz également a 116/117% TDP.
par zaibaker le Vendredi 11 Novembre 2016 à 08h26
Merci encore pour ces détails.
Une interrogation:
Ne puis-je pas me contenter d'un seul rad 360 voir 480 pour refroidir une Titan X Pascal de 300W?
Yep c'est bien calculé comme Pitostreum l'a dit, après si tu veux un peu de silence 1000trs/min ça fait quand meme élevé je trouve, meme avec des ventilo silencieux tu va entre l'air passer dans les radiateurs.
par Pitostreum, le Vendredi 11 Novembre 2016 à 12h27  
Ah, une dernière chose pour le shunt mod.
Je conseillerais d'éviter d'appliquer la "liquid metal" sur les 3 résistances car le risque est que la carte se mette en défaut et bloque à la fréquence 2D.
Certains l'ont fait sur les 3 mais avec une couche très mince.
De toute façon, la Titan XP étant limitée à 1.092v (vstock = 1.05 / 1.06), ça ne sert à rien de faire les 3 car avec 2, il y a largement assez de marge en TDP.
En principe, le faire sur une seule suffit avec la bonne quantité de liquid metal appliquée (ni trop, ni trop peu )
par Pitostreum, le Vendredi 11 Novembre 2016 à 12h19  
par Myloween le Vendredi 11 Novembre 2016 à 00h09
Arf c'est dommage ça, merci Nvidia.
La procédure est détaillée ici :

https://www.youtube.com/watch?v=v1Qi8fxIi_Y

Sur la Titan XP, il y a trois résistances de ce type.
J'ai d'abord appliqué de la Conductonaut (ou de le Cool laboratory Ultra) sur la plus proche du connecteur d'alimentation.
Ça m'a fait gagner dans les 25-30% de TDP puis comme j'avais constaté du throttle sur Firestrike Ultra (et Witcher 3 il me semble), je me suis occupé de la 2e .
Résultat, plus aucun throttle dû au TDP mais on reste limité à la perte de bin liée au franchissement de paliers de 5° (comme expliqué dans la review).
Du coup, c'est quand même bien d'être large en rads car ça permet de limiter l'augmentation de la température de l'eau.
Pour le shunt mod en lui-même, j'ai isolé le pcb de scotch électrique autour de chaque résistance, histoire de ne pas avoir de mauvaise surprise au cas où la "pâte" devait couler. Pour ceux qui ont la carte à la verticale, c'est déjà plus problématique.

@zaibaker : ton estimation est bonne, un rad de 360 ou 480 suffira pour le GPU et un 240 pour le CPU s'il s'agit d'un 4C/8T.
D'autant qu'en principe, les 1080ti custom devraient avoir un bios plus permissif que les FE niveau paliers de bins/température.

La formule = (Total W rads / Total W à dissiper) x 10 (10 étant le delta pour une ventilation à 1000rpm)
par zaibaker, le Vendredi 11 Novembre 2016 à 08h26  
par Myloween le Vendredi 11 Novembre 2016 à 00h09
par Pitostreum le Jeudi 10 Novembre 2016 à 19h40
Merci encore pour ces détails.

Une interrogation:

Ne puis-je pas me contenter d'un seul rad 360 voir 480 pour refroidir une Titan X Pascal de 300W?

Ou c'est insuffisant pour conserver un delta GPU/eau à 10 degrés?

Vous en avez tous mis plusieurs.
Les guides disent qu'un rad 120mm avec une ventilation à 1000trs/min dissipe 100w.
Donc j'ai multiplié par 3.

Ca ne fonctionne pas comme ça?

Si je dois payer plus de 400€ juste pour les radiateurs j'ai comme l'impression que je vais me limiter à un AIO .

Merci de me conseiller car j'été vraiment partie pour me faire ma boucle CPU+GPU avec un rad 360 voir 480 + un de 240 pour le CPU.
par Myloween, le Vendredi 11 Novembre 2016 à 00h09  
par Pitostreum le Jeudi 10 Novembre 2016 à 19h40
Nope, pas possible de modifier le bios des Pascal, Nvidia ayant mis ce qu'il faut comme sécurité, malheureusement :/
[...]
J'ai un waterblock Aquacomputer, avec la backplate à refroidissement actif pour les VRM, utile dans mon cas
Arf c'est dommage ça, merci Nvidia.
Bon si un jour j'ai le courage de démonter je testerais peut etre ce que tu a fais, j'ai quand meme quelques rare chutes a 2050/2035 Mhz sur certain jeux a cause du TDP max.
Le Waterblock Aquacomputer avec la backplate à refroidissement actif me faisait de l'oeil deja au temps de mes XSPC,
mais au final je suis parti sur du EK.
par zaibaker le Jeudi 10 Novembre 2016 à 18h13
Merci pour ces précisions .

En effet ton Water semble surdimensionné, je vais peut-être pouvoir m'inspirer de certaines choses.
Yep mon water est clairement surdimensionné actuellement, ma config précédente demandait beaucoup plus. Après j'ai fait en sorte qu'il soit modulable, si je veux je peu facilement retirer le rad externe avec les quick disconect et faire un circuit plus petit, mais j'ai finalement tout laissé et décidé de miser sur le silence avec les ventilo en 5v.
par Pitostreum, le Jeudi 10 Novembre 2016 à 19h40  
par Myloween le Jeudi 10 Novembre 2016 à 02h11
On ne peu plus dépasser les limites par modification du bios maintenant avec les Titan X Pascal ? (j'avoue etre moins chaud a shunter mes cartes)
Nope, pas possible de modifier le bios des Pascal, Nvidia ayant mis ce qu'il faut comme sécurité, malheureusement :/
Si ta carte tient 2065 constant et sans ajout de tension, c'est déjà très bien.
La mienne ne roxxe pas tant que ça, c'est un boost à 1860 avec juste +120%, tout le reste @stock.
Pour tenir 2088, je dois donc ajouter du jus via MSI AB et évidemment, sans shunt mod, ça throttle sec.

Pour le refroidissement, j'ai ce type de circuit :
- 3 RX480v3
- 2 MCP35X (top double)
- 5960X + R5E refroidis

Côté températures, il faut compter un delta GPU/eau situé entre 8 et 10°. Donc en gros, après quelques heures de jeu (augmentation de la température ambiante), la carte monte à 34/35° (21-22° temp' de l'eau au départ, 25-27 après quelques heures).
J'ai un waterblock Aquacomputer, avec la backplate à refroidissement actif pour les VRM, utile dans mon cas
par zaibaker, le Jeudi 10 Novembre 2016 à 18h13  
par Myloween le Jeudi 10 Novembre 2016 à 17h10
Après honnêtement les 2 marque vraiment au dessus du reste que j'ai pu testé c'est EK et Bitspower, leurs produits sont vraiment de qualité et ça ce sent (et les embouts Barrow aussi).
Les autres marques a coté c'est bof je trouve, c'est beaucoup plus variable.
Merci pour ces précisions .

En effet ton Water semble surdimensionné, je vais peut-être pouvoir m'inspirer de certaines choses.

Pitostreum pourra peut-être me donner une meilleure idée d'un watercooling plus classique s'il prend la peine de passer à l'occasion partager sa configuration .
par Myloween, le Jeudi 10 Novembre 2016 à 17h10  
Après honnêtement les 2 marque vraiment au dessus du reste que j'ai pu testé c'est EK et Bitspower, leurs produits sont vraiment de qualité et ça ce sent (et les embouts Barrow aussi).
Les autres marques a coté c'est bof je trouve, c'est beaucoup plus variable.
par Myloween, le Jeudi 10 Novembre 2016 à 16h55  
par zaibaker le Jeudi 10 Novembre 2016 à 15h01
Il y a-t-il une chance de savoir quelle configuration vous avez Myloween et / ou Pitostreum?
Vraiment curieux de savoir le détails de votre watercooling afin d'en avoir un performant pour ma futur configuration en Kaby + 1080Ti.
Je pense etre vraiment large a ce niveau vu que j'avais un 3-way de Titan kepler avant, donc il y a surement besoin de beaucoup moins, voila les détails.
Fin depuis il y a eu des changement mais c'est globalement ça, pour les Titan X j'ai pris des waterblock EK plexi + un pond SLI pro HB EVGA.
(Photo de ma config actuel avec les Titan X ici).
Je n'ai plus de LEDs actuellement car mon hub avait prit la flotte a cause de bouchon plexy merdique sur le réservoir que j'ai depuis remplacé par des bouchons EK.
Niveau température avec les 3 Kepler j'étais a 38°C max l'été avec les ventilo en 7v, et la avec les 2 Pascal je suis a 40 max avec les ventilo en 5v.
Le proc est a 4.5 mais je peu monter a 4.6/4.7 et les tenir facilement sans dépasser les 73°C si je n'avais pas une RAM avec de aussi haute fréquence, je ne l'ai pas fait car ça m'oblige a avoir un VCCSA a plus de 1.25 pour tenir ma RAM et mon bus sur du h24 (Ivy Bridge supporte mal les RAM a haute fréquence).
par zaibaker, le Jeudi 10 Novembre 2016 à 15h01  
par Myloween le Jeudi 10 Novembre 2016 à 02h11
On ne peu plus dépasser les limites par modification du bios maintenant avec les Titan X Pascal ? (j'avoue etre moins chaud a shunter mes cartes)
Actuellement je tiens sous flotte les 2065Mhz, mais monté au dessus ça deviens compliqué pour mes cartes en l'état.
Il y a-t-il une chance de savoir quelle configuration vous avez Myloween et / ou Pitostreum?
Vraiment curieux de savoir le détails de votre watercooling afin d'en avoir un performant pour ma futur configuration en Kaby + 1080Ti.
par Scrabble, le Jeudi 10 Novembre 2016 à 12h53  
par baddy le Jeudi 10 Novembre 2016 à 12h16
Je ne me plain pas du prix, mais de ne pas payer le juste et vrai prix...
Mais le prix de vente de la Titan X Pascal EST le juste et vrai prix. Ça n'a rien à voir avec les prix d'Apple ou tu paye avant tout la marque. Attends de voir le prix de vente de Vega, tu ne sera pas déçu.
par Claymore_4, le Jeudi 10 Novembre 2016 à 12h53  
par baddy le Jeudi 10 Novembre 2016 à 12h40
Ah bon payer quelque chose plus cher que son prix ne fait pas de toi un pigeon lorsqu'il est cher...? intéressante ta "logique"
C'est fou c'est gens qui se pense plus malin et/ou plus intelligent en fonction de l'épaisseur de leur portefeuille...Mais c'est vrai que tu achètes des avions au prix d'une logan toi t'es un bon
par jesersarien le Jeudi 10 Novembre 2016 à 12h29
si tu veux qu'il avance fait toi aider par un ami ou un proche *, je dis juste pour la 3 ème fois que quand tu peux te le permettre, et y plus de monde que tu ne le crois pour une merde à juste 1300 e, y a rien de bouleversant à payer ce prix et que ça ne fais pas forcément de toi un pigeon. Même si je trouve ça trop cher aussi . Je ne cautionne pas les prix qui me semblent aussi un peu s'envoler.
ou un aide soignant ,)
il y peu, j'ai entendu des enfant dire, "le plus intelligent se tait" ce sont les dire d'enfants,