COMPTOIR
  
register

NVIDIA annonce son GP100 avec 3840 coeurs CUDA et 16Go de HBM2

On en aura eu des pronostics sur Pascal depuis l'annonce de cette nouvelle gamme gravée en 16nm FinFET et remplaçant Maxwell 2 chez NVIDIA. Mais l'attente est terminée, le caméléon venant de dévoiler son GP100 directement sur son devblog. N'attendez pas une carte graphique grand public pour tout de suite par contre, c'est dans la Tesla P100 destinée aux serveurs que la puce s'affichera.

 

nvidia gp100 tesla p100

Le GP100 sur une Tesla P100

 

Au programme de ce GP100, on aura 6 GPC comprenant un maximum de 60 SM (Streaming Multiprocessor), chaque SM  ayant chacun le droit à 64 coeurs CUDA et 4 TMU (Texture Mapping Unit), soit un total de 3840 coeurs CUDA et 240 TMU pour la puce à son plein potentiel. Côté VRAM, on aura huit contrôleurs 512-bit pour un bus mémoire de 4096-bit et jusqu'à 16Go de HBM2 (pour une bande passante maximale théorique de 720Go/s). Dans la Tesla P100, 56 SM sont actifs pour un total de 3584 coeurs CUDA. Comme le montre le tableau qui suit, Maxwell avait abandonné la course au FP64 (calcul double précision), se concentrant sur le FP32 (calcul simple précision),  mais Pascal revient à la charge avec un rapport de 2:1 (FP32:FP64) profitant de la nouvelle finesse de gravure et des dernières avancées technologiques. Cela permettra d'oublier le 3:1 de Kepler et surtout le risible 32:1 de Maxwell.

 

Tesla K40Tesla M40Tesla P100
GPU GK110 (Kepler) GM200 (Maxwell) GP100 (Pascal)
SM 15 24 56
TPC 15 24 28
Coeurs CUDA FP32 / SM 192 128 64
Coeurs CUDA FP32 / GPU 2880 3072 3584
Coeurs CUDA FP64 / SM 64 4 32
Coeurs CUDA FP64 / GPU 960 96 1792
Freq. Base 745 MHz 948 MHz 1328 MHz
Freq. Boost 810/875 MHz 1114 MHz 1480 MHz
FP64 GFLOPs 1680 213 5304
TMU 240 192 224
Bus mémoire 384-bit GDDR5 384-bit GDDR5 4096-bit HBM2
VRAM max Jusqu'à 12 Go Jusqu'à 24 Go Jusqu'à 16 Go
Cache L2 1536 ko 3072 ko 4096 ko
TDP 235 Watts 250 Watts 300 Watts
Transistors 7.1 milliards 8 milliards 15.3 milliards
Taille du die 551 mm² 601 mm² 610 mm²
Gravure 28-nm 28-nm 16-nm

 

Ca annonce du gros gain et on n'en est pas mécontent. Le caméléon exploite les forces de Maxwell en profitant du passage de la gravure 28nm au 16nm FinFET pour corriger le tir en double précision. Les fréquences base/boost sont revues à la hausse et la VRAM a le droit à un gros level up avec l'arrivée de la HBM2. Le point qui pourra faire tiquer est le TPD de 300W, ce qui laisse présager du lourdingue chez les constructeurs partenaires avec gros effort mercatique sur les appellations des dissipateurs à venir. Reste maintenant à voir comment NVIDIA va décliner sa gamme avec quel type de GP100 sur le très haut de gamme, et le GP104 sur le haut de gamme, puisqu'on sait que la HBM2 sera limitée au très haut de gamme et que les GDDR5 et GDDR5X iront peupler les cartes qui suivront. Dans tous les cas, Pascal (tout comme Polaris dans une moindre mesure en l'absence de Vega jusqu'à début 2017) mérite que les joueurs attendent pour changer de GPU !

Un poil avant ?

Vidéo interactive de la prochaine démo VR chez Crytek

Un peu plus tard ...

Need for Speed : du "low" pas moche !

Les 22 ragots
Les ragots sont actuellement
prévention anti troll, loguez-vous !ouverts aux ragoteurs logués
par -------------------, le Jeudi 07 Avril 2016 à 07h14  
par lulu-nico, le Mercredi 06 Avril 2016 à 12h20
Je sais je reprends un ragot précédent.
Si on se base sur la puissance de calcul en simple précision on est en face d'un sli de 980.
Lulu tu es officiellement un Pilier de Comptoir,gaffe a ton foie quand même
par cabou83, le Mercredi 06 Avril 2016 à 12h30  
par Zoroastre, le Mercredi 06 Avril 2016 à 11h33
Le top serait une archi entièrement modulaire comme un fpga qui s'adapte a n'importe quel sorte de calcul. Il me semble que ça sera la futur étape qu'AMD prend avec son futur Navi
Non c'est déjà le cas, GCN est modulaire, Hawaii est très efficace en GPGPU et puissance de calcul, en 28nm c'est la carte professionnel la plus puissante en calcul DP. Mais cette polyvalence implique la consommation qu'on connait, soit une consommation plus grande que les GM200 et la Fury X pour des perf en retrait.
par lulu-nico, le Mercredi 06 Avril 2016 à 12h20  
par TRGNN, le Mercredi 06 Avril 2016 à 12h11
C'est pas une carte pour les jeux mais pour l'accélération de calculs. Ta comparaison n'a pas lieu d'être.
Je sais je reprends un ragot précédent.
Si on se base sur la puissance de calcul en simple précision on est en face d'un sli de 980.
par TRGNN, le Mercredi 06 Avril 2016 à 12h11  
par lulu-nico, le Mercredi 06 Avril 2016 à 11h55
Tu vas vite pour être au niveau de cette titan il faut un si de 980.
Dans une version non castré on serait en face d'un sli de 980 custom.
C'est pas une carte pour les jeux mais pour l'accélération de calculs. Ta comparaison n'a pas lieu d'être.
par lulu-nico, le Mercredi 06 Avril 2016 à 11h55  
par Goolimar, le Mercredi 06 Avril 2016 à 11h09
c'est un GPU taillé uniquement pour le GPGPU, d'ailleurs en appliquant des calculs théoriques un SLI de GTX970 serait (bien) plus perf que le GP100 dans les jeux tout en coutant bien moins cher.
Mais le GP100 n'est PAS fait pour le jeu donc c'est normal.
Il faut attendre un GPU nVidia optimisé pour ça et dé-optimisé pour le GPGPU en contre-partie, ce que l'on accélère pour l'un a tendance à ralentir pour l'autre.
Tu vas vite pour être au niveau de cette titan il faut un si de 980.
Dans une version non castré on serait en face d'un sli de 980 custom.
par Zoroastre, le Mercredi 06 Avril 2016 à 11h33  
Le top serait une archi entièrement modulaire comme un fpga qui s'adapte a n'importe quel sorte de calcul. Il me semble que ça sera la futur étape qu'AMD prend avec son futur Navi
par Goolimar, le Mercredi 06 Avril 2016 à 11h09  
c'est un GPU taillé uniquement pour le GPGPU, d'ailleurs en appliquant des calculs théoriques un SLI de GTX970 serait (bien) plus perf que le GP100 dans les jeux tout en coutant bien moins cher.

Mais le GP100 n'est PAS fait pour le jeu donc c'est normal.

Il faut attendre un GPU nVidia optimisé pour ça et dé-optimisé pour le GPGPU en contre-partie, ce que l'on accélère pour l'un a tendance à ralentir pour l'autre.
par Zoroastre, le Mercredi 06 Avril 2016 à 11h05  
La bête de dos

Avec tout la ram dans le même package que le gpu ca serait pas bete des gpu vendu directement en socket le top une carte mere embarquant deux socket pour le gpu et le cpu le gaint de place et une belle économie de circuits passif et de pcb, en mutualisant certains circuit de puissance uniquement sur la carte mère
par Zoroastre, le Mercredi 06 Avril 2016 à 10h51  
D'apres hardware.fr ce GPU n'aura jamais de declinaison grand publique, ni même en titan ou en quadro, meme pas sur qu'il embarque les circuits pour les sorties video. C'est une puce taillé exclusivement pour les server de calculs
par cabou83, le Mercredi 06 Avril 2016 à 10h32  
3584SP c'est peu, face au 3072sp du GM200. Donc je pense comme HFR, ce GP100 se contentera de sortir en Tesla (peut être Quadro). Mais pas de Geforce l'embarquant.
En Geforce HDG on aura surement un GP104 à 400 voir 450mm2, sans le support des DP et une archi basé sur le gp100 mais plus optimisé "jeux 3D". Il serait possible que le GP104 ait plus de SP, plus de fréquence et donc soit plus puissant que ce die en jeux.
par PoRRas, le Mercredi 06 Avril 2016 à 09h59  
Pas d'info sur les cartes non dédiée au computing? Celle dont on sait qu'elles embarqueront de la GDDR5x?
par lulu-nico, le Mercredi 06 Avril 2016 à 09h33  
par Scrabble, le Mercredi 06 Avril 2016 à 09h30
C'est surtout au niveau du prix de vente que ça n'ira pas ...
D'après hfr ce die ne sera pas décliné en geforce.