Test • nVIDIA GeForce GTX 285 & 295 |
————— 10 Février 2009
Test • nVIDIA GeForce GTX 285 & 295 |
————— 10 Février 2009
• Le GT200b
Késako GT200b ? Eh bien il s'agit d'un simple die shrink (puce identique mais profitant d'un procédé de gravure plus fin réduisant la taille finale de cette dernière et mécaniquement sa consommation) du GT200 en 55nm. Mais simple n'est pas forcément le mot le plus adapté compte tenu du monstre d'origine! Lancé en juin 2008, le GT200 utilisait un procédé de fabrication en 65nm, un choix de gravure relativement conservateur à l'époque (AMD utilisait le 55nm sur ses RV670 depuis fin 2007) probablement dicté par la complexité de la puce, un énorme morceau de silicium de près de 600 mm² et composé d'environ 1,4 Milliard de transistors!
Le GT200 descend directement de l'architecture G80 du caméléon qui a outrageusement dominé le monde de la 3D durant près de 18 mois, par contre, nVIDIA l'a dopé aux hormones. En effet les unités de calculs (Streaming Processor ou SP) du GPU qui pour rappel sont de type scalaire (travaillant sur une seule composante) et non plus vectoriel (travaillant sur 4 ou 5 composantes) comme précédemment utilisé par le caméléon pour des raisons d'efficacité, passent de 128 à 240 soit une augmentation substantielle tout en restant "double pumped" (2 fois plus rapide que le reste de la puce). Pour leur répartition, nVIDIA les a regroupées au sein de multiprocesseurs qui comportent 8 SP, un espace mémoire local (nombre de registres doublé par rapport au G80), des unités dédiées aux fonctions spéciales (Sin, Cos,...) et une unité de calculs flottants 64bits. Enfin, ces multiprocesseurs sont regroupés comme le G80 en clusters (ou partitions) à la différence notable toutefois que chaque partition en intègre 3 contre seulement 2 à celles de "l'ancêtre". Par contre, chaque partition dispose toujours de 8 unités de texturing et d'un cache L1 en sus des multiprocesseurs comme en témoigne le schéma suivant :
Au final, le GT200 dispose donc de 10 partitions (contre 8 au G80) chacune composée de 3 multiprocesseurs pour un total de 240 SP. Ajoutez à cela les 8 contrôleurs 64 bits pour un bus mémoire global de 512 bits, le plus important jamais utilisé sur une carte graphique grand public de quoi fournir une bande passante très importante. Les ROP (unités chargées d'écrire en mémoire et d'appliquer entres autres choses l'Anti-Aliasing) suivent la croissance du bus mémoire et passent ainsi de 24 sur le G80 à 32 sur le GT200. L'augmentation du nombre de partitions entraine mécaniquement le passage de 64 à 80 du nombre d'unités de texturing composant le GT200. nVIDIA a également apporté quelques retouches diverses telle la présence d'un processeur dédié à la gestion des transferts PCIE et permettre à l'instar des Radeon depuis le R600 de recevoir/envoyer des données tout en "travaillant" sur des calculs 3D par exemple.
Les diagrammes c'est bien joli, mais au niveau de la puce, comment tout ce petit monde se répartit-il? La réponse en image ci-dessous pour les plus curieux (mais aussi parce que c'est zzzzzzzzzzzoli ).
Voilà c'est fini pour le petit rappel sur le GT200, la version "b" de ce dernier reprend donc tous ces points mais le passage à un procédé de gravure 55nm permet la réduction notable de la taille de la puce (473 mm² contre 576mm² à la version 65nm) et donc l'augmentation du nombre de ces dernières par Wafer pour des coûts de production en baisse tout comme la consommation. Restent à évoquer les différentes versions de ce GT200b car pour l'heure nVIDIA l'a annoncé officiellement en 2 variantes (3 si l'on prend en compte celle qui équipe certaines GTX 260 216 SP et qui se retrouve amputée en plus du bus mémoire d'une partition. Reste que c'est le flou artistique au niveau des 260 entre les versions 192 SP, 216 SP le tout saupoudré de 65 et 55nm). La première que l'on qualifiera de "complète" est celle qui reprend toutes les caractéristiques et les fréquences les plus poussées, elle anime les GeForce GTX 285 que l'on peut résumer par la copie d'écran de GPUZ suivante :
Le coeur du GPU est donc cadencé à 648Mhz en lieu et place des 602Mhz de la GTX 280 étrennant le GT200 dans sa révision initiale. Les unités de calcul progressent quant à elles davantage en passant à 1476 Mhz contre 1242. Enfin le gigaoctet de GDDR3 (toujours pas de GDDR5) géré via le bus 512 bits passe à 1242 Mhz à la place des 1107 de la GTX 280. Ainsi, nVIDIA profite de son die shrink pour "booster" principalement la puissance de calcul tout en améliorant la bande passante mémoire de sa nouvelle carte haut de gamme mono-GPU. Par contre on en reste au support de DX10 alors que la concurrence en est à DX10.1 depuis quelques temps déjà.
La seconde révision de ce GT200b se retrouve quant à elle dans la GeForce GTX 295 qui porte tous les espoirs de nVidia pour la reconquête du titre de carte 3D la plus rapide. Pour ce faire, pas de secrets, comme c'est le cas depuis quelques temps : l'intégration de 2 GPU sur une même carte. C'est là le second visage du GT200b qui octroie la possibilité au caméléon de faire ce que la version gravée à 65nm n'a pas pu permettre : la création d'une carte bi-GPU à partir de son monstre de 1.4 Milliard de transistors. Bien sûr pas de miracles, malgré la finesse de gravure 55nm, nVIDIA a été contraint de réaliser quelques concessions pour limiter la consommation et l'échauffement de son nouvel étendard, voyons cela :
Tout d'abord les fréquences sont en bernes par rapport aux GTX 28x et sont en fait équivalentes à celles d'une GTX 260. Second point, le bus mémoire se trouve lui aussi amputé d'un contrôleur 64 bits pour passer à 448 bits au total. Conséquence inévitable de cette castration, la mémoire embarquée par GPU passe de 1 GO à 896 MO et les ROP de 32 à 28. Bonne nouvelle par contre, les unités de calculs et de texturing sont intégralement conservées soit respectivement 240 et 80. Malgré ces choix restrictifs, la complexité du bus mémoire et donc du PCB nécessaire restant importante, nVIDIA a opté pour une approche similaire à celle de la 9800 GX2 c'est à dire deux PCB distincts supportant chacun un GPU et sa mémoire et reliés entre eux par un pont dédié (et un switch PCIE pour les transactions avec la carte mère) avec le système de refroidissement au centre rappelant ainsi un sandwich comme en témoigne l'image suivante.
(cliquez pour agrandir)
Voyons tout cela plus en détail page suivante.
|
Un poil avant ?La MSI X58 du pauvre! (MAJ) | Un peu plus tard ...Le dernier SSD Apex d'OCZ en test |