COMPTOIR
register

×

DLSS

Test • Nvidia GeForce RTX 4090
DLSS
DLSS 2.x
DLSS 3
Suivi des vecteurs de mouvement
Suivi de la géométrie du moteur 3D en parrallèle
Association des données collectées
Les gains liés au DLSS 3.0
Les différentes pierres logiciels et matériels du DLSS 3.0

• Deep Learning Super-Sampling 3

A l'occasion du lancement de la RTX 4090, Nvidia insiste très fortement sur la troisième itération de sa technique d'upscaling assisté par IA, aka DLSS. Mais avant de parler de cette dernière, petit rappel des 2 précédentes, dont l'origine remonte à l'introduction de Turing. La promesse était d'offrir des performances en nette hausse, pour une qualité visuelle équivalente à celle atteinte avec un TAA classique. Pour ce faire, le caméléon utilise une build d'un jeu fourni par les développeurs et procède au rendu de dizaines de milliers d'images avec une qualité visuelle parfaite ou presque (64 échantillons par pixel), collectant ainsi le résultat de sortie et les données d'entrée brutes (images en basse résolution et aliasées) qui vont pouvoir être utilisés lors de l'opération d'apprentissage profond (Deep Learning) à venir.

 

Un réseau de neurones artificiels (de type auto-encodeur convolutif) est ensuite entraîné à obtenir cette qualité de sortie avec ces données d'entrée, au moyen de méthodes fortement matheuses (back propagation), ce qui lui permet "d'apprendre" les spécificités propres à ces images. Il résulte de cet apprentissage un DNN model (Deep Neural Network signifie "réseau de neurones profond") capable d'imiter le comportement observé sur l'échantillon utilisé lors de l'apprentissage, et ce pour un coût bien moindre que la technique originelle. Comment ? Par le biais des Tensor Cores, qui utilisent alors le DNN model sur l'image brute aliasée de définition plus faible, pour infèrer en temps réel le rendu anti-aliasé à la définition d'affichage requise. L'inférence est friande des calculs en faible précision où les Tensors Cores excellent.

 

DLSS [cliquer pour agrandir]

 

Voilà pour la théorie, mais à l'exception notable du tout premier jeu proposant cette fonctionnalité (FFXV), la plupart des réalisations suivantes ont été décevantes avec un rendu souvent flou, comme nous l'indiquions ici ou par exemple, Battlefield V détenant le pompon à ce niveau. Toutefois, les verts ne se sont pas contentés de ces premiers essais largement perfectibles, et après une étape intermédiaire encourageante,  la version 2.x a revu en profondeur l'auto-encodeur convolutif, mais ce n'est pas tout.

 

Ainsi, la notion de Temporal Feedback a également été ajoutée, comme illustré ci-dessous. Derrière cette dénomination, se cache l'intégration des vecteurs de mouvement, aux données d'entrée collectées en basse résolution. Ceux-ci sont ensuite appliqués à la précédente image de sortie (haute qualité), afin d'estimer plus précisément quelle sera l'apparence de la prochaine. Cela permet de rendre des images plus nettes (diminuant très notablement le flou qui était le défaut de la première itération) tout en améliorant la stabilité d'une image à la suivante.

 

DLSS 2.x [cliquer pour agrandir]

 

Un mot supplémentaire concernant l'auto-encodeur : ce dernier est à présent commun à tous les jeux (facilitant et accélérant ainsi son intégration au processus de création). Toutefois, il est toujours nécessaire de générer (via apprentissage profond ou Deep Learning dans la langue de Shakespeare) un DNN Model spécifique à chaque jeu par le biais de ce réseau de neurones. A noter également que cette seconde itération de DLSS, permet de choisir différents niveaux de qualité afin de laisser le choix à l'utilisateur. En pratique, il s'agit de faire varier la définition du rendu avant l'inférence des images dans la définition finale.

 

Si vous êtes un habitué du Comptoir, vous avez du voir passer bon nombre de dossiers où nous analysons la qualité visuelle à l'aide de captures vidéo. Le résultat atteint est à présent très satisfaisant dans la plupart des cas, même si certains puristes préfèreront toujours l'option de rendu natif. Pour le DLSS 3, les verts n'ont pas mis l'accent sur une amélioration de la qualité visuelle, cette dernière continuant à s'améliorer au fur et à mesure que le DNN model s'affine par Deep Learning, mais sur la performance. C'est là qu'entre en jeu la fameuse unité OFA décrite dans la page architecture. 

 DLSS 3 [cliquer pour agrandir]

 

Cette dernière va analyser deux images séquentielles dans le jeu et calcule un champ de flux optique. C'est en fait une sorte de carte sur laquelle vont être positionnées la direction et la vitesse à laquelle les pixels se déplacent entre l'image 1 et l'image 2. L'unité OFA est capable de capturer des informations au niveau du pixel telles que des particules, réflexions, ombres et éclairage, qui ne sont pas inclus dans les calculs de vecteur de mouvement du moteur de jeu.

 

Suivi des vecteurs de mouvement [cliquer pour agrandir]

 

Le DLSS 3 utilise (à l'instar de la version 2) également ces vecteurs de mouvement, pour suivre avec précision les déplacements géométriques au sein de la scène. Dans l'exemple ci-dessous, les vecteurs de mouvement suivent avec précision la route passant devant le motard, mais pas son ombre qui est en réalité fixe par rapport à la position de la moto. La génération d'images à l'aide des seuls vecteurs de mouvement du moteur 3D, risquerait donc d'entraîner des anomalies visuelles, telles que le clignotement de cette ombre par exemple.

 

Suivi de la géométrie du moteur 3D en parrallèle [cliquer pour agrandir]

 

Pour chaque pixel, le DLSS 3 va donc "décider" avec l'appui de l'IA, de la meilleure façon d'utiliser toutes ces données collectées pour générer des images intermédiaires cohérentes. Il ne s'agit donc pas ici d'ajouter artificiellement des images pour gonfler les performances, sinon ce serait la foire aux artefacts visuels.

 

Association des données collectées [cliquer pour agrandir]

 

Comme vous pouvez vous en douter, cette technique lorsque fonctionnelle est redoutable, puisqu'aux gains liés à l'upscaling, il faut ajouter ceux liés à la génération d'une image intermédiaire. En pratique, les sept huitièmes que constituent deux images consécutives ne sont pas rendu, mais générés par le DLSS 3. Reste à vérifier l'impact visuel, ce que nous allons faire page suivante. Autre effet positif, la charge de rendu traditionnel est fortement réduite, allégeant le nombre d'appels à rendu à produire pour le CPU, qui devient alors moins limitant.

 

Les gains liés au DLSS 3.0 [cliquer pour agrandir]

 

Pour parfaire l'expérience de jeu et éviter une latence accrue consécutive à cette insertion d'images, le DLSS 3 intègre nativement Reflex au sein du pipeline. Voici résumé en un slide les différentes "pierres" logicielles et matérielles mises en œuvre pour le DLSS 3. Que l'on aime ou pas la société, il faut bien reconnaitre que ses équipes travaillent d'arrache pied pour proposer des solutions innovantes et très évoluées technologiquement.

 

Les différentes pierres logiciels et matériels du DLSS 3.0 [cliquer pour agrandir]

 

Dernière question que l'on est en droit de se poser, pourquoi limiter le DLSS 3 aux seuls cartes Ada alors que l'unité OFA est présente depuis Turing ? Selon Nvidia, cela s'expliquerait par les performances respectives de chaque implémentation. La version Turing n'aurait des capacités réellement exploitables que pour les flux vidéos, et celle d'Ampere ne disposerait pas d'un débit adapté à une analyse suffisamment précise des images rendues.

 

Techniquement, il serait donc possible de faire fonctionner le DLSS 3 avec des cartes de génération précédente, mais la qualité s'en ressentirait avec la présence d'artefacts visuels. C'est en tout cas l'affirmation des verts, même si elle est difficilement vérifiable, elle ne parait pas aberrante pour autant. Quoi qu'il en soit, toute belle que puisse être une solution sur le papier, ce qui compte en définitive, c'est le résultat obtenu en pratique : quid des premières implémentations du DLSS 3 ?



Un poil avant ?

La relève NUC Extreme chez Intel sera encore moins mini-PC-esque qu'avant

Un peu plus tard ...

L'Unreal Engine 5.1 plus très loin de débarquer

Les 143 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Un ragoteur qui draille en Île-de-France, le Lundi 21 Novembre 2022 à 16h50  
par Eric B. le Dimanche 20 Novembre 2022 à 18h14
Pas dans le test principal, désolé. C'est déjà la course pour boucler dans les temps avec cet échantillon en plus des jeux, par contre on réfléchit à des tests axés pro pour les GPU dans des dossiers dédiés.
Ok je comprend pas de souci.
Par contre cest sur que si cela se fait ça seras un gros plus.
Jai pas trouvé de trst pour mes usages.
Jai pris tout de même une rtx3060 vu les prix actuellement.
Mais des tests " pros " en, en montage vidéo, photos serais parfait.
Merci d'avance en tout cas
par Eric B., le Dimanche 20 Novembre 2022 à 18h14  
Pas dans le test principal, désolé. C'est déjà la course pour boucler dans les temps avec cet échantillon en plus des jeux, par contre on réfléchit à des tests axés pro pour les GPU dans des dossiers dédiés.
par Un ragoteur qui draille en Île-de-France, le Dimanche 20 Novembre 2022 à 08h46  
Bonjour.
Sympas cs tests avec des applications "pro".
Ce serais possible d'y ajouter des softs importants comme Premiere pro, After Effect, Lightroom, Photoshop et surtout DXO qui avec DeepPrime utilise énormément la carte graphique?
Possible aussi de faire des ajouts sur les test de la génération précédente ?
Merci
par D en Provence-Alpes-Côte d'Azur, le Mardi 15 Novembre 2022 à 22h04  
Je viens de tester une 4090 gainward phantom(non gs), avec un +200mhz sur le core et +500mhz sur la ram, la carte est très calme en forte charge uhd, impressionnant. ..
Les températures aussi aux alentours des 66 max.
Récupéré à 1800e livré sur ld/lc, j'espère ne pas avoir des problèmes sur le 12vpwr...Pas de gainward sur le megathread reddit, étrange..
par Eric B., le Lundi 14 Novembre 2022 à 11h19  
Je ne l'ai pas démontée, mais c'est un Monolithic Power Systems MP2891 d'après celui réalisé par TPU.
par Un ragoteur sigma-delta en Île-de-France, le Lundi 14 Novembre 2022 à 09h56  
Super test comme d'habitude.
Est-ce qu'il serait possible d'avoir la référence du contrôleur d'alimentation ?
Merci
par Eric B., le Mardi 08 Novembre 2022 à 15h15  
par Un adepte de Godwin au Québec le Mardi 08 Novembre 2022 à 14h37
Juste 18 fps de plus que la 3090 dans flight simulator... je vais attendre la 5090...
As-tu compris que c'est le CPU qui limite la 4090 sur ce test là (c'est écrit pourtant) ? Parce que tu peux attendre même la 7090 que ça n'y changerait absolument rien dans des situations comme celle-ci...
par Un adepte de Godwin au Québec, le Mardi 08 Novembre 2022 à 14h37  
Juste 18 fps de plus que la 3090 dans flight simulator... je vais attendre la 5090...
par Un ragoteur sans nom en Bourgogne-Franche-Comté, le Mercredi 02 Novembre 2022 à 15h26  
par YulFi le Mercredi 02 Novembre 2022 à 09h11
La conso est telle que je m'interroge sur la conso de la carte bloquée à 60 fps. A-t-elle du coup un appétit d'oiseau sur un jeu AAA ?
Un peu comme la fonction Radeon Chill ou limiter les fps in-game. On peut avoir une énorme carte mais par moment vouloir jouer en silence et/ou diminuer la chauffe, je ne trouve pas ça déconnant
Perso l'été je le fais, je bride à 60fps pour diminuer la chauffe quand il fait déjà presque 30°C dans la pièce.

Edit: J'ai en partie trouvé une réponse sur un petit lien tout mignon
Ils brident Cyberpunk à 90fps et la carte ne consomme "que" 215W, pas mal. La 3090 Ti dans le même cas consomme 416W outch !
C'est vrai pour toutes les cartes qui abaisseront leur tension en fonction de la charge demandée, si tant est que la carte ne soit pas déjà à son max à la fréquence d'images demandée. C'est facile à monitorer avec MSi afterburner avec lequel on peut afficher dans un coin de l'écran les informations que l'on veut parmi celles qui sont monitorées.
par Un #ragoteur connecté d'Occitanie, le Mercredi 02 Novembre 2022 à 13h11  
par Un ragoteur sans nom en Bourgogne-Franche-Comté le Mercredi 02 Novembre 2022 à 12h07
Et alors ? Je m'en tamponne totalement de ces considérations. Seul mon budget importe, le reste c'est leur problème.
Entièrement d'accord avec toi. Si certains acceptent de se faire pigeonner, ça les regarde. Le prix des cartes devraient suivre l'évolution du cout de la vie, point barre. Donc en 5 ans, à 3% d'augmentation par an en moyenne, ça nous fait 15%, et pas 150%. Les cartes graphiques sont l'exception dans l'écosystème PC. La conversion €/$ nous est défavorable d'environs 20% provisoirement, Nous n'y pouvons pas grand chose (à part avoir des politiques compétents, mais la aussi c'est la crise)
Il faut bien se rendre compte qu'une carte graphique aujourd'hui coute autant qu'un PC entier moyenne gamme. Il faut arrêter le délire.
Le boum du minage de l'Ethereum est terminé, retour à la case départ. Finit d'amortir les cartes en quelques mois et de faire du pognon avec ensuite, quelque soit le prix ou on pouvait la payer.
J'utilise mes cartes pour des usages pro et je trouve les prix scandaleux, pour un usage ludique c'est encore plus invraisemblable...
par Un ragoteur sans nom en Bourgogne-Franche-Comté, le Mercredi 02 Novembre 2022 à 12h07  
par Un rat goth à l'heure en Provence-Alpes-Côte d'Azur le Mercredi 02 Novembre 2022 à 09h51
450 / 550 lol on est en 2022 pas en 2017....
Entre la guerre, les tensions mondiales, le coût de conception de plus en plus durélevé, les prix de TMSC, et la chute de l'euro bon courage ....
Et alors ? Je m'en tamponne totalement de ces considérations. Seul mon budget importe, le reste c'est leur problème. Je peux espérer trouver une remplaçante plus performante dans les gammes 4060ti/4070 ou des 7700/xt convaincantes dans ces tarifs, même si je dois attendre encore 6 mois à 1an. Vu les MSRP et les tarifs actuels (certes 2 ans après leur sortie), c'est déjà trouvable.
Malheureusement, la 6750xt et la 3070 sont peu convaincantes (+ manque de VRAM avec la 3070 mal foutue), la 6800 tout juste abordable bien que trop proche de son msrp me fait de l'oeil comme jamais. J'attends de voir ce qu'il sort, tant que je ne suis pas dans l'urgence de changer.
par Un rat goth à l'heure en Provence-Alpes-Côte d'Azur, le Mercredi 02 Novembre 2022 à 09h51  
par Un ragoteur sans nom en Bourgogne-Franche-Comté le Samedi 15 Octobre 2022 à 19h32
Le GAP de prix et de conso, sans parler de la taille du bazar, sont eux aussi énormes. Je dirais plutôt indécents. J'ai payé ma 1080ti 678 euros au printemps 2017 grâce à une ristourne de mamazone. Elle me permet de jouer à presque tous les jeux en 1440p moyennant des compromis sur certaines options encore actuellement, presqu'en 2023. Elle est double slot ( oui j'ai une autre carte fille qui va rester en place tant que windows l'accepte ) et tire au max 250W de ma petite entreprise qui ne connaît pas la crise alim.

Je passe mon tour et attendrai les futures cartes à 450-550 euros de l'un ou l'autre des concepteurs (je mets Intel de côté en attendant mieux chez eux), si tant est qu'elles soient convaincantes.
450 / 550 lol on est en 2022 pas en 2017....
Entre la guerre, les tensions mondial, le coût de conception de plus en plus dur, les prix de TMSC, et la chute de l'euro bon courage ....