Test • Nvidia GeForce RTX 4090 |
————— 11 Octobre 2022
Test • Nvidia GeForce RTX 4090 |
————— 11 Octobre 2022
Détaillons à présent les caractéristiques des nouvelles venues en comparaison d'un certain nombre de cartes des segments haut de gamme et Enthusiast, des générations actuelles et passées, que ce soit du côté rouge, comme vert.
Cartes | GPU | Fréq. Boost GPU (MHz) | Fréq. Mémoire (MHz) | Unités de calcul FP32 | TMU | ROP | Taille mémoire (Go) | Bus mémoire (bits) | Calcul SP (Tflops) | Bande Passante (Go/s) | TGP (W) |
---|---|---|---|---|---|---|---|---|---|---|---|
R9 280 | Tahiti | 933 | 1250 | 1792 | 112 | 32 | 3 | 384 | 3,3 | 240 | 200 |
R9 280X | Tahiti | 1000 | 1500 | 2048 | 128 | 32 | 3 | 384 | 4,1 | 288 | 250 |
R9 285 | Tonga | 918 | 1375 | 1792 | 112 | 32 | 2 | 256 | 3,3 | 176 | 190 |
R9 380 | Tonga | 970 | 1425 | 1792 | 112 | 32 | 2 / 4 | 256 | 3,5 | 182 | 190 |
R9 380X | Tonga | 970 | 1425 | 2048 | 128 | 32 | 4 | 256 | 4 | 182 | 190 |
R9 390 | Hawaii | 1000 | 1500 | 2560 | 160 | 64 | 8 | 512 |
5,1 |
384 | 275 |
R9 390X | Hawaii | 1050 | 1500 | 2816 | 176 | 64 | 8 | 512 | 5,9 | 384 | 275 |
RX Vega56 | Vega 10 | 1471 | 800 | 3584 | 224 | 64 | 8 | 2048 | 10,5 | 410 | 210 |
RX Vega64 | Vega 10 | 1546 | 946 | 4096 | 256 | 64 | 8 | 2048 | 12,7 | 484 | 295 |
Radeon VII | Vega 20 | 1750 | 1000 | 3840 | 240 | 64 | 16 | 4096 | 13,4 | 1024 | 300 |
RX 5700 |
Navi 10 | 1625 | 1750 | 2304 | 144 | 64 | 8 | 256 | 7,5 | 448 | 180 |
RX 5700 XT | Navi 10 | 1755 | 1750 | 2560 | 160 | 64 | 8 | 256 | 9 | 448 | 225 |
RX 6800 | Navi 21 | 1815 |
1988 |
3840 | 240 | 96 | 16 | 256 | 13,9 | 509 | 250 |
RX 6800 XT | Navi 21 | 2015 | 1988 | 4608 | 288 | 128 | 16 | 256 | 18,6 | 509 | 300 |
RX 6900 XT | Navi 21 | 2015 | 1988 | 5120 | 320 | 128 | 16 | 256 | 20,6 | 509 | 300 |
RX 6950 XT | Navi 21 | 2100 | 2238 | 5120 | 320 | 128 | 16 | 256 | 21,5 | 573 | 335 |
GTX 1070 | GP104 | 1683 | 2003 | 1920 | 120 | 64 | 8 | 256 | 6,5 | 256 | 150 |
GTX 1070 Ti | GP104 | 1683 | 2003 | 2432 | 152 | 64 | 8 | 256 | 8,2 | 256 | 180 |
GTX 1080 | GP104 | 1733 | 1251 | 2560 | 160 | 64 | 8 | 256 | 8,9 | 320 | 180 |
GTX 1080 Ti | GP102 | 1582 | 1376 | 3584 | 224 | 88 | 11 | 352 | 11,3 | 484 | 250 |
RTX 2070 | TU106 | 1620 | 1750 | 2304 | 144 | 64 | 8 | 256 | 7,5 | 448 | 175 |
RTX 2070 SUPER | TU104 | 1770 | 1750 | 2560 |
160 |
64 | 8 | 256 | 9,1 | 448 | 215 |
RTX 2080 | TU104 | 1710 | 1750 | 2944 | 184 | 64 | 8 | 256 | 10,1 | 448 | 215 |
RTX 2080 SUPER | TU104 | 1815 | 1938 | 3072 | 192 | 64 | 8 | 256 | 11,2 | 496 | 250 |
RTX 2080 Ti | TU102 | 1545 | 1750 | 4352 | 272 | 88 | 11 | 352 | 13,5 | 616 | 250 |
RTX 3070 | GA104 | 1725 | 1750 | 5888 | 184 | 96 | 8 | 256 | 20,3 | 448 | 220 |
RTX 3070 Ti | GA104 | 1770 | 1188 | 6144 | 192 | 96 | 8 | 256 | 21,7 | 608 | 290 |
RTX 3080 | GA102 | 1710 | 1188 | 8704 | 272 | 96 | 10 | 320 | 29,8 | 760 | 320 |
RTX 3080 12 Go | GA102 | 1710 | 1188 | 8960 | 280 | 96 | 12 | 384 | 30.6 | 912 | 350 |
RTX 3080 Ti | GA102 | 1665 | 1188 | 10240 | 320 | 112 | 12 | 384 | 34,1 | 912 | 350 |
RTX 3090 | GA102 | 1695 | 1219 | 10496 |
328 |
112 | 24 | 384 | 35,6 | 936 | 350 |
RTX 3090 Ti | GA102 | 1860 | 1313 | 10752 | 336 | 112 | 24 | 384 | 40 | 1008 | 450 |
RTX 4080 12 Go | AD104 | 2610 | 1313 | 7680 | 240 | 80 | 12 | 192 | 40.1 | 504 | 285 |
RTX 4080 16 G0 | AD103 | 2505 | 1400 | 9728 | 304 | 112 | 16 | 256 | 48.7 | 717 | 320 |
RTX 4090 | AD102 | 2520 | 1313 | 16384 | 512 | 176 | 24 | 384 | 82.6 | 1008 | 450 |
La puissance de calcul en MAD (FP32) de la RTX 4090 est multipliée par 2,3 par rapport à sa devancière (2,1 par rapport à la 3090 Ti). Pas de doute, nous avons bien affaire affaire ici à une nouvelle génération, comme le traduit ce bond considérable. Côté bande passante mémoire, le gain n'est par contre que de 7,7 % et même nul par rapport à la 3090 Ti. Alors quoi, nous avons affaire ici à un GPU déséquilibré ? Pas de panique, il ne faut pas oublier que le cache L2 a été multiplié par 12 entre la 3090 et la 4090, de quoi amplifier très nettement la bande passante si les données nécessaires sont présentes au sein de ce dernier. C'est par contre difficilement mesurable à la simple lecture des caractéristiques techniques, tâchons donc d'y voir un peu plus clair avec quelques tests synthétiques.
Nous utilisons la suite de tests Geeks 3D pour tâcher d'identifier les performances des nouvelles venues dans divers domaines. PixMark Julia FP32, permet de mesurer le débit de pixels en simple précision, il dépend donc à la fois de la puissance de calcul et des ROP. Le test GiMark, mesure les performances de nos cartes sur une scène très chargée au niveau de la géométrie, TessMark mesurant quant à lui les capacités en tesselation. Ces tests étant relativement brefs et spécifiques (n'utilisant donc pas toutes les ressources), ils permettent aux modèles limités par leur température ou puissance autorisée, de conserver des fréquences plus élevées qu'une session de jeu durant son exécution.
Quand on parle de nouvelle génération, ce ne sont pas que des mots. La seule vue du test FP32 permet de se faire une petite idée de ce à quoi on va avoir droit ici, avec une progression de 85 % en comparaison de la 3090 et 68 % face au modèle Ti (qui pour rappel utilise une version intégrale de GA102 ce qui est loin d'être le cas de l'AD102 intégré à la RTX 4090). Les gains en termes de géométrie sont bien plus réduits (de l'ordre de 20 %), mais il est fort probable que cela soit du fait d'une limitation CPU. Enfin, le résultat en tesselation montre à nouveau des gains de l'ordre de 80 % entre générations.
Passons à présent à notre seconde série de tests synthétiques, issus cette fois de 3DMark, et s'attachant à vérifier les capacités des cartes graphiques sur divers points. Le premier nommé DXR, permet de solliciter les capacités d'accélération du Ray Tracing au travers de l'API de Microsoft. Et là, comment dire, Ada colle une raclée à tout le monde. Nvidia a particulièrement insisté sur son travail au niveau du Ray Tracing, les résultats sont probants. Le second test, Mesh Shader, entend vérifier la capacité de traitement de ces derniers par les GPU modernes. Si le test permet de comparer les performances avec et sans ces Mesh Shaders, cette représentation rend la comparaison entre cartes impossible. Nous avons donc décidé d'afficher les performances avec Mesh Shaders actifs. À nouveau la 4090 domine, mais l'écart moindre nous fait nous interroger une fois encore sur une éventuelle limitation CPU.
Le test PCIe mesure le débit de l'interface éponyme et confirme ici l'usage des 16 lignes PCIe 4.0 pour AD102, qui n'aura donc pas le privilège d'être le premier GPU PCIe 5.0. Le test Sampler Feedback, va évaluer de son côté cette fonctionnalité apportée par DX12 Ultimate et supportée depuis les cartes Turing via le Texture Space Shading. La 4090 créée encore des écarts considérables, avec ici + 66% vs la 3090. Finissons par le test VRS, acronyme de Variable Rate Shading, dans sa version Tier 2, permettant de mesurer le gain apporté par cette fonctionnalité lorsqu'elle est activée. Là aussi, le test exprime une comparaison entre 2 passes (avec et sans), c'est pourquoi nous affichons ici le score atteint une fois la fonctionnalité activée, pour permettre une comparaison brute entre cartes. A nouveau AD102 annihile toute forme de concurrence, avec des ratios de l'ordre de 2 entre génération !
C'est tout pour cette partie, voyons page suivante le protocole de test.
|