COMPTOIR
  
register

Test • Nvidia GeForce RTX 4090

• Spécifications

Détaillons à présent les caractéristiques des nouvelles venues en comparaison d'un certain nombre de cartes des segments haut de gamme et Enthusiast, des générations actuelles et passées, que ce soit du côté rouge, comme vert.

 

CartesGPUFréq. Boost GPU (MHz)Fréq. Mémoire (MHz)Unités de calcul FP32TMUROPTaille mémoire (Go)Bus mémoire (bits)Calcul SP (Tflops)Bande Passante (Go/s)TGP (W)
R9 280 Tahiti 933 1250 1792 112 32 3 384 3,3 240 200
R9 280X Tahiti 1000 1500 2048 128 32 3 384 4,1 288 250
R9 285 Tonga 918 1375 1792 112 32 2 256 3,3 176 190
R9 380 Tonga 970 1425 1792 112 32 2 / 4 256 3,5 182 190
R9 380X Tonga 970 1425 2048 128 32 4 256 4 182 190
R9 390 Hawaii 1000 1500 2560 160 64 8 512

5,1

384 275
R9 390X Hawaii 1050 1500 2816 176 64 8 512 5,9 384 275
RX Vega56 Vega 10 1471 800 3584 224 64 8 2048 10,5 410 210
RX Vega64 Vega 10 1546 946 4096 256 64 8 2048 12,7 484 295
Radeon VII Vega 20 1750 1000 3840 240 64 16 4096 13,4 1024 300

RX 5700 

Navi 10 1625 1750 2304 144 64 8 256 7,5 448 180
RX 5700 XT Navi 10 1755 1750 2560 160 64 8 256 9 448 225
RX 6800 Navi 21 1815

1988

3840 240 96 16 256 13,9 509 250
RX 6800 XT Navi 21 2015 1988 4608 288 128 16 256 18,6 509 300
RX 6900 XT Navi 21 2015 1988 5120 320 128 16 256 20,6 509 300
RX 6950 XT Navi 21 2100 2238 5120 320 128 16 256 21,5 573 335
GTX 1070 GP104 1683 2003 1920 120 64 8 256 6,5 256 150
GTX 1070 Ti GP104 1683 2003 2432 152 64 8 256 8,2 256 180
GTX 1080 GP104 1733 1251 2560 160 64 8 256 8,9 320 180
GTX 1080 Ti GP102 1582 1376 3584 224 88 11 352 11,3 484 250
RTX 2070 TU106 1620 1750 2304 144 64 8 256 7,5 448 175
RTX 2070 SUPER TU104 1770 1750 2560

160

64 8 256 9,1 448 215
RTX 2080 TU104 1710 1750 2944 184 64 8 256 10,1 448 215
RTX 2080 SUPER TU104 1815 1938 3072 192 64 8 256 11,2 496 250
RTX 2080 Ti TU102 1545 1750 4352 272 88 11 352 13,5 616 250
RTX 3070 GA104 1725 1750 5888 184 96 8 256 20,3 448 220
RTX 3070 Ti GA104 1770 1188 6144 192 96 8 256 21,7 608 290
RTX 3080 GA102 1710 1188 8704 272 96 10 320 29,8 760 320
RTX 3080 12 Go GA102 1710 1188 8960 280 96 12 384 30.6 912 350
RTX 3080 Ti GA102 1665 1188 10240 320 112 12 384 34,1 912 350
RTX 3090 GA102 1695 1219 10496

328

112 24 384 35,6 936 350
RTX 3090 Ti GA102 1860 1313 10752 336 112 24 384 40 1008 450
RTX 4080 12 Go AD104 2610 1313 7680 240 80 12 192 40.1 504 285
RTX 4080 16 G0 AD103 2505 1400 9728 304 112 16 256 48.7 717 320
RTX 4090 AD102 2520 1313 16384 512 176 24 384 82.6 1008 450

 

La puissance de calcul en MAD (FP32) de la RTX 4090 est multipliée par 2,3 par rapport à sa devancière (2,1 par rapport à la 3090 Ti). Pas de doute, nous avons bien affaire affaire ici à une nouvelle génération, comme le traduit ce bond considérable. Côté bande passante mémoire, le gain n'est par contre que de 7,7 % et même nul par rapport à la 3090 Ti. Alors quoi, nous avons affaire ici à un GPU déséquilibré ? Pas de panique, il ne faut pas oublier que le cache L2 a été multiplié par 12 entre la 3090 et la 4090, de quoi amplifier très nettement la bande passante si les données nécessaires sont présentes au sein de ce dernier. C'est par contre difficilement mesurable à la simple lecture des caractéristiques techniques, tâchons donc d'y voir un peu plus clair avec quelques tests synthétiques.

 

 

• Tests synthétiques

Nous utilisons la suite de tests Geeks 3D pour tâcher d'identifier les performances des nouvelles venues dans divers domaines. PixMark Julia FP32, permet de mesurer le débit de pixels en simple précision, il dépend donc à la fois de la puissance de calcul et des ROP. Le test GiMark, mesure les performances de nos cartes sur une scène très chargée au niveau de la géométrie, TessMark mesurant quant à lui les capacités en tesselation. Ces tests étant relativement brefs et spécifiques (n'utilisant donc pas toutes les ressources), ils permettent aux modèles limités par leur température ou puissance autorisée, de conserver des fréquences plus élevées qu'une session de jeu durant son exécution.

 

Quand on parle de nouvelle génération, ce ne sont pas que des mots. La seule vue du test FP32 permet de se faire une petite idée de ce à quoi on va avoir droit ici, avec une progression de 85 % en comparaison de la 3090 et 68 % face au modèle Ti (qui pour rappel utilise une version intégrale de GA102 ce qui est loin d'être le cas de l'AD102 intégré à la RTX 4090). Les gains en termes de géométrie sont bien plus réduits (de l'ordre de 20 %), mais il est fort probable que cela soit du fait d'une limitation CPU. Enfin, le résultat en tesselation montre à nouveau des gains de l'ordre de 80 % entre générations.

 

 

Passons à présent à notre seconde série de tests synthétiques, issus cette fois de 3DMark, et s'attachant à vérifier les capacités des cartes graphiques sur divers points. Le premier nommé DXR, permet de solliciter les capacités d'accélération du Ray Tracing au travers de l'API de Microsoft. Et là, comment dire, Ada colle une raclée à tout le monde. Nvidia a particulièrement insisté sur son travail au niveau du Ray Tracing, les résultats sont probants. Le second test, Mesh Shader, entend vérifier la capacité de traitement de ces derniers par les GPU modernes. Si le test permet de comparer les performances avec et sans ces Mesh Shaders, cette représentation rend la comparaison entre cartes impossible. Nous avons donc décidé d'afficher les performances avec Mesh Shaders actifs. À nouveau la 4090 domine, mais l'écart moindre nous fait nous interroger une fois encore sur une éventuelle limitation CPU.

 

Le test PCIe mesure le débit de l'interface éponyme et confirme ici l'usage des 16 lignes PCIe 4.0 pour AD102, qui n'aura donc pas le privilège d'être le premier GPU PCIe 5.0. Le test Sampler Feedback, va évaluer de son côté cette fonctionnalité apportée par DX12 Ultimate et supportée depuis les cartes Turing via le Texture Space Shading. La 4090 créée encore des écarts considérables, avec ici + 66% vs la 3090. Finissons par le test VRS, acronyme de Variable Rate Shading, dans sa version Tier 2, permettant de mesurer le gain apporté par cette fonctionnalité lorsqu'elle est activée. Là aussi, le test exprime une comparaison entre 2 passes (avec et sans), c'est pourquoi nous affichons ici le score atteint une fois la fonctionnalité activée, pour permettre une comparaison brute entre cartes. A nouveau AD102 annihile toute forme de concurrence, avec des ratios de l'ordre de 2 entre génération !

 

 

C'est tout pour cette partie, voyons page suivante le protocole de test.



Un poil avant ?

La relève NUC Extreme chez Intel sera encore moins mini-PC-esque qu'avant

Un peu plus tard ...

L'Unreal Engine 5.1 plus très loin de débarquer

Les 143 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !