NVIDIA annonce son GP100 avec 3840 coeurs CUDA et 16Go de HBM2 |
————— 06 Avril 2016 à 06h58 —— 21234 vues
NVIDIA annonce son GP100 avec 3840 coeurs CUDA et 16Go de HBM2 |
————— 06 Avril 2016 à 06h58 —— 21234 vues
On en aura eu des pronostics sur Pascal depuis l'annonce de cette nouvelle gamme gravée en 16nm FinFET et remplaçant Maxwell 2 chez NVIDIA. Mais l'attente est terminée, le caméléon venant de dévoiler son GP100 directement sur son devblog. N'attendez pas une carte graphique grand public pour tout de suite par contre, c'est dans la Tesla P100 destinée aux serveurs que la puce s'affichera.
Le GP100 sur une Tesla P100
Au programme de ce GP100, on aura 6 GPC comprenant un maximum de 60 SM (Streaming Multiprocessor), chaque SM ayant chacun le droit à 64 coeurs CUDA et 4 TMU (Texture Mapping Unit), soit un total de 3840 coeurs CUDA et 240 TMU pour la puce à son plein potentiel. Côté VRAM, on aura huit contrôleurs 512-bit pour un bus mémoire de 4096-bit et jusqu'à 16Go de HBM2 (pour une bande passante maximale théorique de 720Go/s). Dans la Tesla P100, 56 SM sont actifs pour un total de 3584 coeurs CUDA. Comme le montre le tableau qui suit, Maxwell avait abandonné la course au FP64 (calcul double précision), se concentrant sur le FP32 (calcul simple précision), mais Pascal revient à la charge avec un rapport de 2:1 (FP32:FP64) profitant de la nouvelle finesse de gravure et des dernières avancées technologiques. Cela permettra d'oublier le 3:1 de Kepler et surtout le risible 32:1 de Maxwell.
Tesla K40 | Tesla M40 | Tesla P100 | |
---|---|---|---|
GPU | GK110 (Kepler) | GM200 (Maxwell) | GP100 (Pascal) |
SM | 15 | 24 | 56 |
TPC | 15 | 24 | 28 |
Coeurs CUDA FP32 / SM | 192 | 128 | 64 |
Coeurs CUDA FP32 / GPU | 2880 | 3072 | 3584 |
Coeurs CUDA FP64 / SM | 64 | 4 | 32 |
Coeurs CUDA FP64 / GPU | 960 | 96 | 1792 |
Freq. Base | 745 MHz | 948 MHz | 1328 MHz |
Freq. Boost | 810/875 MHz | 1114 MHz | 1480 MHz |
FP64 GFLOPs | 1680 | 213 | 5304 |
TMU | 240 | 192 | 224 |
Bus mémoire | 384-bit GDDR5 | 384-bit GDDR5 | 4096-bit HBM2 |
VRAM max | Jusqu'à 12 Go | Jusqu'à 24 Go | Jusqu'à 16 Go |
Cache L2 | 1536 ko | 3072 ko | 4096 ko |
TDP | 235 Watts | 250 Watts | 300 Watts |
Transistors | 7.1 milliards | 8 milliards | 15.3 milliards |
Taille du die | 551 mm² | 601 mm² | 610 mm² |
Gravure | 28-nm | 28-nm | 16-nm |
Ca annonce du gros gain et on n'en est pas mécontent. Le caméléon exploite les forces de Maxwell en profitant du passage de la gravure 28nm au 16nm FinFET pour corriger le tir en double précision. Les fréquences base/boost sont revues à la hausse et la VRAM a le droit à un gros level up avec l'arrivée de la HBM2. Le point qui pourra faire tiquer est le TPD de 300W, ce qui laisse présager du lourdingue chez les constructeurs partenaires avec gros effort mercatique sur les appellations des dissipateurs à venir. Reste maintenant à voir comment NVIDIA va décliner sa gamme avec quel type de GP100 sur le très haut de gamme, et le GP104 sur le haut de gamme, puisqu'on sait que la HBM2 sera limitée au très haut de gamme et que les GDDR5 et GDDR5X iront peupler les cartes qui suivront. Dans tous les cas, Pascal (tout comme Polaris dans une moindre mesure en l'absence de Vega jusqu'à début 2017) mérite que les joueurs attendent pour changer de GPU !
Un poil avant ?Vidéo interactive de la prochaine démo VR chez Crytek | Un peu plus tard ...Need for Speed : du "low" pas moche ! |