Test • GeFORCE GTX 1070 & 1080

Core Ultra 5 245K : 13 refs en stock Tendance baissière
Core i5-14600k : 7 refs en stock Tendance baissière
Core Ultra 7 265K : 10 refs en stock Tendance stable
Core i5-14700k : 19 refs en stock Tendance baissière
Core Ultra 9 285K : 3 refs en stock Tendance baissière
Tendance stable
RTX 4060 ti : 34 refs en stock Tendance baissière
Ryzen 9600X : 1 ref en stock Tendance stable
RTX 4070 SUPER : 3 refs en stock Tendance haussière
Tendance baissière
RTX 4080 SUPER : 2 refs en stock Tendance baissière
Ryzen 9700X : 3 refs en stock Tendance stable
Ryzen 7 7700X : 3 refs en stock Tendance stable
Ryzen 9 7800X3D : 8 refs en stock Tendance baissière
ryzen 9800X3D : 6 refs en stock Tendance baissière
RTX 4090 : 1 ref en stock Tendance stable
RX 7600 : 9 refs en stock Tendance baissière
RX 7700 XT : 10 refs en stock Tendance baissière
Ryzen 9 7950X3D : 6 refs en stock Tendance stable
RX 7800 XT : 4 refs en stock Tendance haussière
RX 7900 XT : 7 refs en stock Tendance baissière
PS5 Pro : 5 refs en stock Tendance haussière

La réception • Tests & articles • Cartes graphiques

• Pascal

Pour concevoir son nouveau GP104, NVIDIA s'appuie donc sur sa dernière architecture Pascal. Toutefois, cette dernière qui a été inaugurée au travers du GP100, une puce monstrueuse de 610 mm² que l'on retrouve au sein de la gamme Tesla dédiée au GPU Computing, diffère justement entre les 2 GPU. Nous préciserons ce point au cours de cette page. Elle succède donc à Maxwell et Kepler, elles-mêmes fortement basées sur Fermi qui a posé les fondations des puces modernes du caméléon. Si vous n'êtes pas au fait de ces architectures, nous vous invitons à relire ce dossier par exemple pour en comprendre les grands principes. Ainsi, GP104 s'appuie toujours sur des unités polyvalentes nommées Streaming Multiprocessor ou SM pour les intimes. Mais avant de détailler tout cela, commençons par le traditionnel diagramme GPU d'un point de vue macroscopique :

diagram gp104 t [cliquer pour agrandir]

Diagramme logique du GP104 - Cliquer pour agrandir

Ces SM sont regroupés au sein des GPC (Graphics Processor Cluster) qui intègrent également un Raster Engine ou moteur de rastérisation, chargé de découper les triangles en pixels. Mais la subtilité provient à présent de l'apparition de TPC pour Texture Processor Cluster. Kesako ? Le nom est trompeur puisqu'il s'agit en fait de la structure regroupant SM et Polymorph Engine, c'est-à-dire les unités dédiées à la géométrie et que le caméléon décrivait précédemment comme faisant partie intégrante des SM. C'était donc une simplification adoptée lors des représentations schématiques, puisqu'il n'y avait à chaque fois qu'un SM par TPC. Ce n'est plus forcément le cas avec Pascal puisque le GP100 en propose 2 par TPC, c'est d'ailleurs une des différences avec GP104 qui reste lui à la valeur 1. Si le nombre de GPC n'évolue pas (toujours 4) entre GM204 et GP104, leur composition diffère avec cette fois 5 TPC (contre 4 précédemment), portant ainsi le nombre total de SM à 20 pour le GPU complet. Avant de détailler ces derniers, jetons un coup d'oeil au sous-système mémoire.

Le bus mémoire reste inchangé à 256-bit puisque toujours constitué de 8 contrôleurs 32-bit, le cache L2 associé à chacun d'entre eux est également le même (256 Ko) soit un total de 2 Mo pour le GPU. Par contre, le caméléon ne se contente pas d'associer de la GDDR5 à ces contrôleurs, mais également, et pour la première fois sur une carte graphique, de la GDDR5X. Cette dernière adopte un fonctionnement QDR (Quad Data Rate) qui permet de doubler la bande passante à fréquence équivalente. La consomamtion est donc mécaniquement en baisse, par contre cela implique un prefetch doublé à 16n et des accès en 512-bit, ce qui ne pose pas de problème particulier aux GPU friands avant tout de bande passante.

g5x

Les première puces GDDR5X sont certifiées à 10 Gbps soit +25% par rapport aux meilleures GDDR5, mais NVIDIA ne s'est pas contenté de ce point et indique avoir retravaillé ses algorithmes de compression (sans perte) des couleurs afin de réduire les besoins en bande passante mémoire. C'est en particulier le cas de la technique Delta Color, qui permet de calculer l'écart entre 2 couleurs sur des pixels adjacents plutôt que de coder indépendamment chaque couleur de pixel, ce qui peut être très bénéfique si les couleurs sont proches.

Delta Color

La compression Delta Color

Ces algorithmes implémentés depuis Fermi, en sont donc à leur quatrième révision qui permet de proposer davantage de choix de calculs Delta au "compresseur". Afin de mettre en avant les progrès liés à cette nouvelle itération, ;NVIDIA propose les 3 clichés ci-dessous représentant les images tirées de Project CARS sans compression, avec la compression induite par les puces de génération Maxwell et enfin celle de la génération Pascal :

Compression couleur

Exemples de mise en oeuvre Delta Color : A gauche sans compression, au milieu avec Maxwell et à droite Pascal

Au final avec l'accroissement de l'efficacité des divers algorithmes de compression couleur, NVIDIA annonce une augmentation de 20% de la bande passante effective du GP104 par rapport au GM204. Si l'on combine cet effet aux gains liés cette fois à l'emploi de GDDR5X, on parvient à une augmentation de 70% de la bande passante effective !

Gain compression couleur

Avant d'attaquer en détail l'évolution des SM, un dernier mot pour préciser que le nombre de ROP (vous savez, les petites bêtes chargées d'écrire en mémoire) n'évolue pas par rapport au GM204, toutefois ces derniers pourront profiter à l'instar du reste du GPU de l'augmentation de fréquence rendu possible par le nouveau procédé de gravure 16nm FinFET+ de TSMC. Voyons à présent ce qu'ils ont dans le ventre ces fameux SM :

Un SM, au coeur de Pascal

Si on exclut le fait que le Polymorph Engine (qui passe en version 4.0) n'en fasse plus partie (ce qui n'a jamais été vraiment le cas en réalité, sic), les SM du GP104 ressemblent comme 2 gouttes à ceux du GM204. On retrouve donc les 128 unités de calcul simple précision couplées à 32 unités de calcul SFU pour les opérations spéciales. N'apparaissent pas sur le schéma, mais sont bien présentes 2 unités de calcul en double précision (64-bit) pour assurer la compatibilité. Le GP100 diffère justement à ce niveau puisqu'il propose par SM, 64 unités de calcul SP et 32 unités DP. Côté TMU ou unités de texturing, pas de changement non plus puisque l'on reste à l'instar de Maxwell à 8 par SM.

La hiérarchie mémoire au sein du SM est également identique, tout du moins entre GM204 et GP104 avec 96 ko intégralement dédiés à la mémoire partagée et le cache L1 à 24 Ko. Le GP100 voit de son côté la mémoire partagée progresser à 128 Ko. Au final, les unités de calcul SP passent de 2048 sur GM204 à 2560 sur GP104, quant aux TMU, elles suivent la même inflation en passant de 128 à 160. Pascal dans sa version GP104 est donc très proche d'un GM204 qui aurait subit une inflation de 25% des unités de Calcul et de texturing. Tout cela nous donne un joli bébé de 7,2 milliards de transistors pour 314 mm² gravé en 16nm. GK104 gravé en 28nm se contentait lui de 3,54 milliards pour 294 mm² alors que GM204 avait connu de son côté une inflation notable avec 398mm² toujours en 28nm et près de 5,2 milliards de transistors. NVIDIA a donc fait le choix de revenir à une taille de die proche des 300 mm² pour cette gamme de puces. Face à la concurrence, la superficie de GP104 le situe en deçà de Tonga (5 milliards de transistors / 368 mm²) en attendant Polaris gravée en 14 nm et annoncée bien plus petite (~230mm²).

16 nm

On le voit donc clairement, le nouveau procédé de gravure permet de faire exploser le nombre de transistors par mm². La stagnation de ces process dans le domaine GPU a contrarié les deux géants du secteur qui s'y sont adaptés avec plus ou moins de succès. La nouveauté cette année en sus de l'abaissement de la finesse en elle-même, c'est le choix entre deux acteurs : TSMC propose du 16nm qui permet grosso modo de doubler la densité et un gain de fréquence important du fait d'une conception 3D des transistors (FinFET). Samsung est le second acteur avec son process 14nm (FinFET également) à priori 9% plus dense (si on se base sur les puces Apple A9 produites via les deux fondeurs) et disponible en deux versions : LPE (Low Power Early) et LPP (Low Power Plus), la seconde permettant d'atteindre des fréquences 15% plus élevées associées à une consommation en baisse de 15%. C'est cette version licenciée à Global Foundries qui sera utilisée par AMD, NVIDIA ayant choisi TSMC.
Cette variable supplémentaire peut-être un facteur de réussite ou d'échec des stratégies respectives, mais aussi de placement des puces. Il est difficile de déterminer à l'heure actuelle quel est le meilleur choix : il semble que le 14 nm donne un petit avantage à AMD en termes de densité, donc de taille des die pour un même nombre de transistors et en conséquence de leur nombre sur un Wafer (disque de silicium sur lequel sont gravés les puces) déterminant le coût unitaire d'un GPU.

Mais ce n'est pas si simple : les Yield (rendement de puces fonctionnelles aux spécifications demandées), le coût de production (NVIDIA étant un plus gros client il peut probablement obtenir des tarifs potentiellement plus intéressants) et la performance du process (montée en fréquence, consommation, etc.) peuvent nuancer très largement cette première assertion. Ce qui est sûr c'est que le caméléon a souhaité profiter du passage au 16nm FinFET+ pour pousser largement les fréquences de son GP104, avec succès comme nous le verrons dans quelques pages. Cette stratégie peut être payante puisqu'un avantage de 30% en termes de fréquence face au concurrent permet un gain du même ordre au niveau des performances sans avoir besoin d'élargir la puce et donc augmenter les coûts. Wait & see donc.

Passons à présent aux diverses nouveautés apportées par cette génération Pascal en page suivante.

Un poil avant ?

Edge est bon pour la batterie de votre portable, contrairement aux autres navigateurs

Un peu plus tard ...

Un petit kit clavier/souris chez Sharkoon, le SharkZone GK15

sommaire

Sur le comptoir, au ~même sujet

	Stray, le simulateur de matou testé sur nos (très) chers GPU
	Un test GPU pour The Quarry, la merveille de Supermassive Games au casting XXL
	Sniper Elite 5 passe le test des balles des GPU
	Un test GPU pour Miles Morales, l'autre Spider-Man de 2022
	Trek to Yomi, un test GPU pour un titre envoutant
	Test • Intel Core i9-12900K/12900F / i7-12700K / i5-12600K/12600/12400F & Z690/B660
	Test • GeForce GTX 970 & 980
	Test • Intel Core i9-13900K, Core i7-13700K, Core i5-13600K & Z790
	Test • AMD Ryzen 9 7950X, 7900X, Ryzen 7 7700X & Ryzen 5 7600X : Zen 4, AM5, X670E, B650E & DDR5
	Test • AMD Radeon RX 6800 & RX 6800 XT
	Test • Nvidia GeForce RTX 4070 Ti
	Test • NVIDIA GeFORCE RTX 3080

Les 75 ragots

Les ragots sont actuellement
prévention anti troll, loguez-vous !ouverts aux ragoteurs logués

Changer l'ordre d'affichage des ragôts
Vous devez être identifié pour changer cette option !

par Thibaut G., le Jeudi 16 Février 2017 à 19h25

par doudoubrocolit le Jeudi 16 Février 2017 à 19h20

Est-ce que en jeu, la GTX 1080 apporte une grande différence par apport à une GTX 1070 ou même une GTX 1060(parce que le prix change lui et pas en bien !!)

quelle est ta définition d'écran ? As tu un écran gsync ? rien que ces questions orienteront grandement la réponse

par doudoubrocolit, le Jeudi 16 Février 2017 à 19h20

Est-ce que en jeu, la GTX 1080 apporte une grande différence par apport à une GTX 1070 ou même une GTX 1060(parce que le prix change lui et pas en bien !!)

par Eric B., le Jeudi 08 Septembre 2016 à 15h21

Clairement non.

par yermiaou, le Mardi 06 Septembre 2016 à 23h31

Bonjour,

J'ai une GTX 1070 G1 Gaming (Gigabyte) avec un I5 6400 (stock). Est-ce qu'un upgrade CPU serait nécessaire selon vous ? Merci bien

par BiChOu, le Jeudi 28 Juillet 2016 à 13h09

Je viens d'avoir la mienne (1080) aujourd'hui que'est ce que je suis content, et merci pour le test

par Pascal M., le Mercredi 20 Juillet 2016 à 19h29

Ceux qui rencontrent des soucis d'affichage des graphs merci d'utiliser le bouton signaler ou la page contact du site prévus à cet effet

Et merci de préciser les éléments suivants :
- FAI/box ?
- OS ?
- Proxy/VPN ?
- JS activé sur les navigateurs ?
- Utilisation de bloqueurs pub ou tout autre soft filtrant ?
- Détails de la console (ctrl+maj+i) sur le problème rencontré ?

par Eric B., le Mardi 19 Juillet 2016 à 17h37

par mart666 le Dimanche 17 Juillet 2016 à 15h18

Est-ce que c'est la bonne carte pour jouer à GTA 4 en 1080P sans que ça rame ?

Pas essayé, à l'occasion je jetterai un oeil à GTA 4.

par mart666 le Dimanche 17 Juillet 2016 à 12h45

Les graphiques ne s'affichent pas et qu'à leur place on voit :
Not Found

The requested URL /public/chart/131 was not found on this server. ??

J'ai déjà signalé le truc avec le bouton... ça pas l'air de marcher...

Pas de pb particulier de mon côté, as-tu essayé avec d'autres navigateurs ?

par mart666, le Dimanche 17 Juillet 2016 à 15h18

Est-ce que c'est la bonne carte pour jouer à GTA 4 en 1080P sans que ça rame ?

Edit : GTA 4 fonctionne relativement bien malgré quelques saccades en jeu. Incroyable la puissance que ce jeu demande...

Message de mart666 supprimé par un modérateur : merci d'utiliser le bouton signaler ou la page conctact pour ce genre de choses :)

par Pascal M., le Mercredi 13 Juillet 2016 à 16h41

par Lionin le Mercredi 29 Juin 2016 à 06h57

Comme beaucoup j'ai pas trop d'idée des performances là dessus, et de plus, Nvidia lance des technologies spécifiques dont on ignore totalement les performances réelles par absence de test.

Le pbl majeure étant surtout que cette première gen de casque n'est pas exploitable, définition m*rdique oblige et comme le dit Eric support soft aléatoire. Donc intérêt limité.. pour le moment en tout cas.

par Eric B., le Mercredi 29 Juin 2016 à 12h04

Pour le moment, nous ne sommes pas équipés pour la VR (c'est quand même pas mal lorsque l'on teste de voir ce qui se passe) et le bench de Steam n'est pas ce qu'il y a de plus fiable dans le domaine (on verra pour celui de Futuremark). Donc oui pourquoi pas, dès que l'on pourra le faire dans de bonnes conditions.

par Lionin, le Mercredi 29 Juin 2016 à 06h57

Très bon test.

Une petite question déjà posée dans les commentaires, mais es ce que vous envisagez la VR dans vos tests?

Comme beaucoup j'ai pas trop d'idée des performances là dessus, et de plus, Nvidia lance des technologies spécifiques dont on ignore totalement les performances réelles par absence de test.

Bonne journée.

• Pascal

Edge est bon pour la batterie de votre portable, contrairement aux autres navigateurs

Un petit kit clavier/souris chez Sharkoon, le SharkZone GK15

sommaire

Sur le comptoir, au ~même sujet

les dernières brèves, en bref, pour aller vite, toussa.

les derniers articles, pointus, précis, comme la mouette.

pour les médias du Comptoir 2006 - 2099 (ça, c'est fait)