Test • NVIDIA GeFORCE RTX 2060 |
————— 07 Janvier 2019
Test • NVIDIA GeFORCE RTX 2060 |
————— 07 Janvier 2019
Pour ceux intéressés par l'architecture Turing, nous vous invitons à lire le dossier que nous lui avons consacré il y a quelque temps. Résumée en quelques lignes, cette dernière ressemble beaucoup à Volta avec quelques ajouts. Par rapport à Pascal (gaming) : des caches plus gros et rapides, des SM "plus petits" mais plus nombreux et capables de traiter en parallèle les calculs sur entiers ou en virgule flottante (y compris en demi-précision (FP16) à double vitesse). Ces derniers intègrent à présent des Tensor Cores, accélérant significativement les calculs liés à l'intelligence artificielle, en particulier l'inférence, ainsi que les RT Cores, pierre angulaire de l'accélération matérielle du Ray Tracing, utilisable en temps réel dans les jeux via un rendu hybride, mixant cette technique à une base rastérisation.
Turing en chiffres dans sa déclinaison dédiée à la RTX 2080 Ti
NVIDIA a conçu à partir de cette architecture 3 GPU (pour le moment), le plus "petit", alias TU106, se retrouve au sein de la RTX 2070, mais aussi de la carte qui nous intéresse aujourd'hui, à savoir la RTX 2060. Ce GPU mesure tout de même un peu moins de 450 mm², soit très proche du flagship (hors pro) de la génération précédente (GP102). Le procédé de fabrication TSMC 12 nm FFN est personnalisé pour le caméléon (FFN = FinFET NVIDIA), il s'agit d'une optimisation du 16 nm FinFET Plus du fondeur, dont les gains ne sont pas à chercher du côté de la densité, mais de la performance des transistors, afin de rester dans une enveloppe thermique "gérable", malgré l'explosion de leur nombre. Vous retrouverez ci-dessous un résumé des différents GPU utilisés sur le haut de gamme des GeFORCE série 10 et 20.
Cartes | GPU | Nombre de transistors | Superficie Die |
Densité (Millions de transistors / mm²) | Procédé de fabrication |
---|---|---|---|---|---|
GeForce RTX 2080 Ti | TU102 | 18,6 Milliards | 754 mm² | 24,7 | TSMC 12 nm FFN |
GeForce RTX 2080 | TU104 | 13,6 Milliards | 545 mm² | 24,9 | TSMC 12 nm FFN |
GeForce RTX 2070/60 | TU106 | 10,8 Milliards | 445 mm² | 24,3 | TSMC 12 nm FFN |
GeForce GTX 1080 Ti | GP102 | 12 Milliards | 471 mm² | 25,5 | TSMC 16 nm FF+ |
GeForce GTX 1080/70 (Ti) | GP104 | 7,2 Milliards | 314 mm² | 22,9 | TSMC 16 nm FF+ |
GeForce GTX 1060 | GP106 | 4,4 Milliards | 200 mm² | 22 | TSMC 16 nm FF+ |
TU106 s'appuie sur 3 GPC, réduisant d'autant les unités de rastérisation, mais reprenant la constitution de ceux utilisés par TU102, soit la présence de 6 TPC / 12 SM. On peut donc voir TU106 comme un demi TU102, à l'interface mémoire près. En effet, alors que le caméléon utilise un bus mémoire 192-bit sur ses puces série xx06 depuis plusieurs années, ce sont cette fois pas moins de 8 contrôleurs mémoire qui prennent place au sein du die, pour une largeur cumulée de 256-bit, la même que TU104. Il en va de même pour les éléments liés, c'est-à-dire les 64 ROP et 4 Mo de cache L2.
Le GPU utilisé sur la GeForce RTX 2060 est toutefois "incomplet", ce qui signifie que le caméléon a désactivé un certain nombre de blocs/unités pour faciliter la production : certaines puces partiellement défectueuses lors de la gravure, peuvent donc répondre aux spécifications retenues par NVIDIA pour sa RTX 2060, permettant ainsi de les "recycler", augmentant d'autant les rendements avec un effet bénéfique sur les coûts de production. Voici résumées les principales caractéristiques dans le tableau ci-dessous.
GeForce RTX 2060 | Quantité activée | Quantité Présente |
---|---|---|
GPC | 3 | 3 |
TPC / SM | 15 / 30 | 18 / 36 |
CUDA Cores | 1920 | 2304 |
TMU | 120 | 144 |
Tensor Cores | 240 | 288 |
RT Cores | 30 | 36 |
ROP | 48 | 64 |
L2 (Mo) | 3 | 4 |
Bus mémoire (bits) | 192 | 256 |
Ainsi, 6 SM sont désactivés (sans plus de précision quant à la répartition entre GPC), mais également 2 contrôleurs mémoire 32-bit, portant la largeur du bus à 192-bit, identique à celle que l'on retrouvait sur la GTX 1060. Les partitions (x8) d'unités de rendu (ROP) liées aux contrôleurs mémoire, sont de facto désactivées, tout comme le cache L2 associé.
Avant d'attaquer la description de la carte testée en page suivante, un petit rappel sur un changement notable au niveau de la gestion des fréquences appliquées au processeur graphique via GPU Boost. Ce mécanisme a pour objectif de pousser chaque puce au plus près de ses limites, en s'affranchissant de tests trop sélectifs en sortie de production. C'est en effet GPU Boost qui est chargé par la suite, de s'assurer que les conditions environnementales permettent au GPU de fonctionner de manière stable et sans risque. Pour ce faire, il impose un double carcan constitué d'une limite de consommation et de température selon l'itération. Avec la version 3 introduite lors du lancement de Pascal, à partir de 37°C et tous les 5°C supplémentaires, le GPU perd 1 bin (~13 MHz) et ce jusqu'à la consigne de température maximale. Il perd alors autant de bins que nécessaire pour rester sous celle-ci.
La fréquence progressant de concert avec la tension d'alimentation du GPU, c'est un moyen très efficace pour contrôler la consommation (qui évolue au carré de la tension et dispose aussi de sa propre limite), évitant ainsi une envolée des nuisances sonores, avec un refroidisseur pas forcément dimensionné pour la dissiper discrètement, ce qui est le cas des Founders Edition à turbine. Le souci d'une telle approche, est la pénalisation de toutes les cartes Pascal, y compris les customs des constructeurs tiers, avec des refroidisseurs surdimensionnés. En effet, NVIDIA autorise la modification du TDP max. des cartes, mais en aucun cas les paliers de température par défaut de GPU Boost 3.0. Ci-dessous une représentation graphique de ce fonctionnement.
Avec Turing, NVIDIA a annoncé GPU Boost 4.0. En gros, ce dernier fonctionnerait de manière similaire, mais avec un ajustement qui fait toute la différence. En effet, les valeurs de températures sont à présent exposées, il est donc possible de les modifier. Bien sûr, il est nécessaire de rester dans la plage autorisée par le caméléon, mais le seuil à 37°C qui marquait le "début de la baisse" des fréquences, n'est plus imposé. Cela coïncide avec l’utilisation d'un refroidisseur plus performant sur les Founders Edition, qui ne perdent donc plus de fréquence du fait de la température. Toujours est-il, qu'il était très difficile de s'approcher du TDP max sur ces dernières en version Pascal, à part lors des premiers instants de forte sollicitation, ce ne sera plus le cas avec les versions Turing, qui seront davantage limitées par leur enveloppe thermique. Ci-dessous, la représentation schématique de GPU Boost 4.0. Notons également qu'un bin, prend à présent la valeur de 15 MHz, contre 13 MHz auparavant.
Voilà pour le sujet, passons page suivante à la description de la GeForce RTX 2060 FE.
|
Un poil avant ?SSD : Phison E12 et NVMe annoncés chez Seagate, ainsi qu'un SSD dédié aux NAS | Un peu plus tard ...AMD annonce ses premiers Ryzen 3000 pour portables |