Test • NVIDIA GeFORCE GTX 1660 |
————— 14 Mars 2019
Test • NVIDIA GeFORCE GTX 1660 |
————— 14 Mars 2019
Pour ceux intéressés par l'architecture Turing, nous vous invitons à lire ou relire le dossier que nous lui avons consacré il y a quelque temps. Résumée en quelques lignes, cette dernière ressemble beaucoup à Volta avec quelques ajouts. Par rapport à Pascal (gaming) : des caches plus gros et rapides, des SM "plus petits" mais plus nombreux et capables de traiter en parallèle les calculs sur entiers ou en virgule flottante (y compris en demi-précision (FP16) à double vitesse).
Voilà pour la partie "classique" de l'architecture, NVIDIA a complété cette dernière par des Tensor Cores, accélérant significativement les calculs liés à l'intelligence artificielle, en particulier l'inférence, ainsi que les RT Cores, dédiés à l'accélération matérielle (des calculs d'intersection rayons / triangles) du Ray Tracing, utilisable en temps réel dans les jeux via un rendu hybride, mixant cette technique à une base rastérisation.
Turing en chiffres dans sa déclinaison dédiée à la RTX 2080 Ti
Mais ces nouvelles fonctionnalités sont loin d'être gratuites en termes de "coût transistors", avec pour conséquence des dies pour le moins imposants et donc onéreux à produire, du fait d'un nombre réduit de ces derniers par Wafer (disques en silicium sur lesquels sont gravés les puces). Mais ça, c'était avant, puisque le petit dernier s'affranchit des RT et Tensors Cores, afin d'atteindre un coût de production plus adapté au marché visé.
NVIDIA a donc conçu à partir de sa dernière architecture, un quatrième GPU nommé TU116, qui se retrouve au sein des GTX 1660 / 1660 Ti. En toute logique, le préfixe RTX laisse la place à GTX du fait de l'absence des nouvelles fonctionnalités. Le die de TU116 mesure 286 mm², à mettre en perspective des 445 mm² de TU106 équipant les RTX 2060/2070. Cette baisse de 36% permet au caméléon de graver plus de GPU par Wafer, faisant mécaniquement baisser les coûts de production puisqu'il achète ces derniers aux fondeurs. Le procédé de fabrication 12 nm FFN est personnalisé pour les verts (FFN = FinFET NVIDIA) par TSMC, il s'agit en fait d'une optimisation du "16 nm FinFET Plus" existant. Les gains ne sont pas à chercher du côté de la densité de gravure, mais de la performance des transistors, afin de rester dans une enveloppe thermique "gérable", malgré l'explosion de leur nombre. Vous retrouverez ci-dessous un résumé des différents GPU utilisés sur le haut et moyen de gamme des GeForce série 10, 20 et 16.
Cartes | GPU | Nombre de transistors | Superficie Die |
Densité (Millions de transistors / mm²) | Procédé de fabrication |
---|---|---|---|---|---|
GeForce RTX 2080 Ti | TU102 | 18,6 Milliards | 754 mm² | 24,7 | TSMC 12 nm FFN |
GeForce RTX 2080 | TU104 | 13,6 Milliards | 545 mm² | 24,9 | TSMC 12 nm FFN |
GeForce RTX 2070/60 | TU106 | 10,8 Milliards | 445 mm² | 24,3 | TSMC 12 nm FFN |
GeForce GTX 1660 (Ti) | TU116 | 6,6 Milliards | 286 mm² | 23,1 | TSMC 12 nm FFN |
GeForce GTX 1080 Ti | GP102 | 12 Milliards | 471 mm² | 25,5 | TSMC 16 nm FF+ |
GeForce GTX 1080/70 (Ti) | GP104 | 7,2 Milliards | 314 mm² | 22,9 | TSMC 16 nm FF+ |
GeForce GTX 1060 | GP106 | 4,4 Milliards | 200 mm² | 22 | TSMC 16 nm FF+ |
TU116 s'appuie comme TU106 sur 3 GPC, réduisant d'autant les unités de rastérisation. Par contre, il reprend la configuration de ceux utilisés par TU102, c'est à dire incluant 4 TPC / 8 SM. On peut donc voir TU116 comme un demi TU104 amputé de ses RT / Tensors Cores et à l'interface mémoire près. En effet, cette dernière n'est réduite que d'un quart, puisque le caméléon utilise un bus mémoire 192-bit via 6 contrôleurs 32-bit, qui prennent place au sein du die et sont capables de gérer aussi bien la GDDR 6 que 5. Enfin, la réduction est du même ordre pour les éléments liés, c'est-à-dire les ROP (par partition de 8) et le cache L2, pour des valeurs respectives de 48 et 3 Mo.
Le GPU utilisé sur la GeForce GTX 1660 est incomplet, ce qui signifie que le caméléon désactive certains blocs/unités pour faciliter la production. Le suffixe Ti de sa grande sœur utilisant un GPU complet, laissait entrevoir l'arrivée d'une GTX 1660, configurée via la technique traditionnelle de "recyclage" des puces partiellement défectueuses, augmentant d'autant les rendements avec un effet bénéfique sur les coûts de production. Voici résumées les principales caractéristiques de son GPU dans le tableau ci-dessous et les désactivations opérées.
GeForce GTX 1660 | Quantité activée | Quantité Présente |
---|---|---|
GPC | 3 | 3 |
TPC / SM | 11 / 22 | 12 / 24 |
CUDA Cores | 1408 | 1536 |
TMU | 88 | 96 |
Tensor Cores | - | - |
RT Cores | - | - |
ROP | 48 | 48 |
L2 (Mo) | 3 | 3 |
Bus mémoire (bits) | 192 | 192 |
A noter également que le moteur d’affichage vidéo est inchangé par rapport aux précédentes puces Turing, il en est de même pour les encodeurs et décodeurs intégrés, dont vous retrouverez le détail ici. Finissons cette page par un dernier rappel, celui concernant le grand ordonnanceur des fréquences GPU des GeForce, à savoir GPU Boost dans sa quatrième itération, étrennée avec ces nouvelles générations de cartes, du moins les RTX.
Ce mécanisme a pour objectif de pousser chaque puce au plus près de ses limites, en s'affranchissant de tests trop sélectifs en sortie de production. C'est en effet GPU Boost qui est chargé par la suite, de s'assurer que les conditions environnementales permettent au GPU de fonctionner de manière stable et sans risque. Pour ce faire, il impose un double carcan constitué d'une limite de consommation et de température selon l'itération. Avec la version 3 introduite lors du lancement de Pascal, à partir de 37°C et tous les 5°C supplémentaires, le GPU perd 1 bin (~13 MHz) et ce jusqu'à la consigne de température maximale. Il perd alors autant de bins que nécessaire pour rester sous celle-ci.
La fréquence progressant de concert avec la tension d'alimentation du GPU, c'est un moyen très efficace pour contrôler la consommation (qui évolue au carré de la tension et dispose aussi de sa propre limite), évitant ainsi une envolée des nuisances sonores, avec un refroidisseur pas forcément dimensionné pour la dissiper discrètement à fréquence maximale durant une charge soutenue, ce qui est le cas des Founders Edition à turbine. Le souci d'une telle approche, est la pénalisation de toutes les cartes Pascal, y compris les customs des constructeurs tiers, avec des refroidisseurs surdimensionnés. En effet, NVIDIA autorise la modification du TDP max. des cartes, mais en aucun cas des paliers de température par défaut de GPU Boost 3.0. Ci-dessous une représentation graphique de ce fonctionnement.
Avec Turing version RTX, NVIDIA a annoncé GPU Boost 4.0. En gros, ce dernier fonctionnerait de manière similaire, mais avec un ajustement qui fait toute la différence. En effet, les valeurs de températures sont à présent exposées, il est donc possible de les modifier. Bien sûr, il est nécessaire de rester dans la plage autorisée par le caméléon, mais le seuil à 37°C qui marquait le "début de la baisse" des fréquences, n'est plus imposé. Cela coïncide avec l’utilisation d'un refroidisseur plus performant sur les Founders Edition, qui ne perdent donc plus de fréquence du fait de la température. Toujours est-il, qu'il était très difficile de s'approcher du TDP max sur ces dernières en version Pascal, à part lors des premiers instants de forte sollicitation. Ce ne sera plus le cas avec les versions Turing RTX, qui seront davantage limitées par leur enveloppe thermique. Ci-dessous, la représentation schématique de GPU Boost 4.0. Notons également qu'un bin, prend à présent la valeur de 15 MHz, contre 13 MHz auparavant.
Nous avons précisé RTX car il semble bien que la série 16 ne soit pas gouvernée par la dernière itération de GPU Boost, mais la précédente ou un mix des deux, plus de détails à ce sujet page 17. Voilà pour les rappels, passons page suivante à la description de la MSI GeForce GTX 1660 Gaming X.
|