Preview • Turing : la révolution Ray Tracing & IA ? |
————— 14 Septembre 2018
Preview • Turing : la révolution Ray Tracing & IA ? |
————— 14 Septembre 2018
Côté moteur vidéo, NVIDIA introduit sur ses nouvelles cartes un port VirtualLink, qui permet de faire transiter au travers d'un connecteur USB Type-C, 4 lignes DisplayPort HBR3 pour les flux vidéos (32,4 Gb/s) et 2 canaux USB 3.1 Gen 2 (10 Gbps) pour les données. Il est également capable de fournir une puissance allant jusqu'à 27 W, qui peut se traduire par une consommation de 35 W supplémentaires côté carte graphique, sans amputer pour autant le budget TDP alloué à cette dernière. De quoi raccorder les futurs casques VR avec un seul et unique câble, tout en proposant des débits vidéos compatibles avec 2 écrans UHD à 90 Hz.
En ce qui concerne les sorties plus traditionnelles, au programme 3 DisplayPort 1.4a avec DSC 1.2 (protocole de compression sans perte). À noter que le moteur vidéo supporte l'usage simultané de 2 écrans 8K à 60 Hz. À cela, s'ajoute un port HDMI 2.0b intégrant le protocole de protection HDCP 2.2, pour ceux désirant par exemple lire depuis leur PC un Blu-ray 4K, sur leur téléviseur UHD. Enfin, le caméléon précise que le HDR est à présent géré nativement au niveau du pipeline vidéo. Tone mapping (BT.2100) est à ce titre inclus dans le pipeline HDR et permet d'approximer les images HDR sur un afficheur SDR.
Finissons cette section par le moteur d'encodage/décodage résumé dans le slide ci-dessous. Côté décodage, Turing apporte par rapport à Pascal/Volta, le HEVC YUV444 (8/10/12 bit) et le VP9 (10/12 bit). Pour l'encodage cette fois, la principale nouveauté est la prise en charge du HEVC 8K HDR à 30 images par seconde. On remarquera surtout les progrès qualitatifs annoncés par NVIDIA au niveau de l'encodeur, qui parviendrait à un meilleur résultat à ce niveau qu'un encodage CPU x264 Fast. Ce n'est certes pas encore au niveau de 2 passes CPU, toutefois, ce gain qualitatif est toujours appréciable pour des vidéos, par exemple destinées au web et profitant de la vitesse de traitement du GPU.
Côté overclocking, les verts annoncent avoir fait évoluer la situation pour faciliter la recherche des performances maximales pour les utilisateurs. Petit rappel du principe de fonctionnement des GeForce récentes au niveau des fréquences appliquées au GPU : ces dernières évoluent le long d'une courbe associant à chaque valeur une tension donnée. Lorsque l'utilisateur sur-cadence son GPU, il applique en fait un offset (décalage) de la fréquence associée à une tension donnée. Cette technique à l'avantage d'éviter une explosion de la consommation, puisque cette dernière évolue au carré de la tension. Par contre, l'option d'overvolting proposée par certains logiciels, ne permet pas de son côté d'appliquer un offset de la tension sur la courbe, mais prolonge cette dernière en ajoutant des couples fréquences/tension en bout de celle-ci.
L'overclocking des puces vertes consiste donc à rechercher l'offset le plus important possible tout en conservant le GPU stable. C'est là que la situation se complique, puisque les fréquences évoluant le long de la courbe ci-dessus, il se peut qu'un couple après offset ne soit pas stable, mais rien ne dit que le couple suivant ne le soit pas... Le souci étant que la carte ne reste jamais à une fréquence fixe, cette dernière fluctuant, selon les limites de consommation et température.
Il est possible depuis le lancement de Pascal, d'individualiser l'offset par couple fréquence/tension, mais cela nécessite un temps considérable, d'autant qu'il est nécessaire de le faire pour des types de charges différentes (offset stable dans un jeu mais pas forcément dans un autre, suivant le type de charge par exemple). Les verts annoncent du nouveau pour simplifier cette recherche, avec NVIDIA Scanner. Ce dernier permet de suivre le comportement du GPU au sein de la courbe après offset, en enregistrant les valeurs dans une base de données sauvegardée.
Ainsi, même en cas de plantage, le dernier couple stable pourra être rappelé. Pour valider la stabilité, NV Scanner propose un algorithme de test propre à NVIDIA, qui vérifie l'exactitude de calculs demandés au GPU, via une sollicitation spécifique créée à cet effet, et validant ainsi l'intégralité de la courbe en une vingtaine de minutes. Une API permet aux applications tierces (Precision X1, Afterburner, etc.) d'accéder à NV Scanner et de le mettre en oeuvre pour automatiser la recherche de fréquences GPU maximales.
Poursuivons avec la quête des performances maximales, toujours selon le caméléon, via une nouvelle évolution du SLi. Avec l’avènement de Pascal, NVIDIA avait amélioré son interface dédiée en augmentant la fréquence de 400 MHz à 650 MHz, tout en autorisant l'utilisation de 2 ponts simultanés entre 2 cartes, soit un débit multiplié par 3,25 dans le meilleur des cas. Cela permettait de régler les soucis de bande passante insuffisante dans le cas des définitions > QHD. Le caméléon va cette fois plus loin en adoptant son interface professionnelle NVLink (avec quelques restrictions toutefois, afin de conserver un avantage à ses très onéreuses cartes pro), sur ses nouvelles GeForce.
On notera que les séries xx60 et inférieures avaient été privées de SLi en 2016, 2 ans plus tard, la RTX 2070 perd elle aussi cet attribut, réservé au segment Enthusiast à présent, le multi-GPU étant utile pour ceux qui recherchent les performances extrêmes ou le compute, d'après NVIDIA. Au-delà de la dénomination de la carte privée de SLi cette année, on constatera surtout que la "frontière d'accession" à ce dernier, n'a pas bougé côté gamme de GPU.
Ainsi, les puces séries x02 et x04 en sont dotées, ce n'est plus le cas à partir de la série x06 à l'instar de Pascal (mais la RTX 2070 s'appuie à présent sur une telle puce). Un lien NVLink 8x est actif sur la RTX 2080, la version Ti en proposant deux, ce qui permet d'atteindre 50 Go/s par sens de transmission, 100 Go/s en cumulé. Pour finir sur le sujet, Il est nécessaire pour mettre en oeuvre ce SLi New Gen, d'acquérir des ponts dédiés, en version 3 ou 4 slots, qui coûteront la bagatelle de 79$ pièce, quand même.
À l'occasion du lancement de Pascal, NVIDIA avait également communiqué sur VRWorks Audio et publié quelques temps plus tard un SDK pour son intégration au sein des jeux VR. L'objectif de cette technologie étant de positionner correctement le son dans un environnement virtuel. Avec Turing, ce dernier évolue en tirant parti des capacités de calcul en Ray Tracing de l'architecture. Ainsi, la propagation des ondes sonores peut utiliser les mêmes algorithmes que ceux régissant les rayons lumineux, en s'appuyant sur le moteur Ray Tracing maison : OptiX.
NVIDIA indique que dans ces conditions, Turing peut s'avérer pour ces tâches, plus de 6 fois plus rapide que Pascal. Là-aussi, ces chiffres doivent être pris avec du recul, car ne concernent bien entendu que le traitement sonore, l'expérience VR nécessitant de gérer également la partie visuelle, bien plus gourmande en ressources. Il est toutefois intéressant de noter cette évolution, qui pourra rendre l’immersion encore plus réaliste.
Finissons par Ansel, qui n'est là aussi, pas une nouveauté a proprement parler, puisque cette fonctionnalité proposée au travers des pilotes, permet de réaliser des copies d'écrans améliorées (il est possible de déplacer la caméra, augmenter la définition, ajouter des effets, etc.). Il fallait précédemment, l'intégration impérative du SDK au niveau du jeu pour fonctionner. Ce n'est plus le cas pour plus de 150 jeux avec lesquels Ansel fonctionnera après coup, suite à une capture d'écran traditionnelle. Des restrictions interviendront toutefois : plus de caméra libre ou d'amélioration des images via Ray Tracing. À ce sujet, que le caméléon nomme Ansel RT, il est possible de flatter davantage la rétine avec des captures d'écrans disposant d'un rendu en Ray Tracing plus poussé qu'en temps réel (forcément, il n'y a plus besoin d'assurer la fluidité d'un déplacement), en multipliant le nombre de rayons par pixel.
Voilà pour un tour d'horizon rapide et pas forcément exhaustif des nouveautés qui accompagnent le lancement des nouvelles GeForce RTX, reste à présent à évaluer les performances en jeu de ces dernières.
|
1 • Préambule |
2 • Turing, une architecture qui évolue |
3 • RT Cores / Tensor Cores / Rendu hybride |
4 • 3 cartes = 3 GPU |
5 • Les nouvelles fonctionnalités |
6 • |
7 • Conclusion |