NVIDIA dévoile le GV100, ça c'est fait et ça fait peur ! |
————— 11 Mai 2017 à 06h58 —— 17553 vues
NVIDIA dévoile le GV100, ça c'est fait et ça fait peur ! |
————— 11 Mai 2017 à 06h58 —— 17553 vues
Hier à 18 heures, NVIDIA tenait une conférence par la voix de son patron lors de la GTC. Le géant a dévoilé son GV100, c'est-à-dire sa plus puissante puce Volta. Rien n'est dit sur d'éventuelles déclinaisons pour le grand public, mais il y a fort à parier qu’elle restera cantonnée au deep learning et autres calculs lourds, car elle a des caractéristiques qui sont impressionnantes et qui font peur en même temps. Pour commencer, la première carte à inaugurer cette bête de GPU est la TESLA V100. Elle embarquera pas moins de 5120 cœurs CUDA, ce qui représente un bond de 43% par rapport aux 3584 unités du GP100. Taillée pour du calcul massif comme le Deep learning ou toute autre forme d'intelligence artificielle, le caméléon l'a doté d'une puissance de calcul de 15 TFLOPS en FP32 (contre 10.6 au GP100) et 7.5 TFLOPS en FP64 (contre 5.3 au GP100). Enfin elle aura 16Mo de cache, 20Mo pour les registres, et utilisera le bus NVLink 2 à 300Go/s pour les communications entre les GPU ou entre CPU et GPU dans une machine dédiée calcul. Son GV100 sera gravé en 12nm FFN par TSMC, aura 21 milliards de transistors, énorme, tout comme sa taille : 815mm² !
Il y aura 16 gigots maxi de mémoire HBM2 Samsung qui offriront une bande passante de 900Go/s à 878 MHz, le tout sur bus 4096-bit. Enfin le GV100 de la carte de lancement moulinera à 1455 MHz via turbo. Ce monstre, parce que c'en est un, est constitué de 6 GPC comprenant 7 TPC pièce. Chaque TPC comporte 2 SM, chaque SM compte quant à lui 64 cœurs CUDA. Ce n'est pas tout, chaque SM comprend 4 blocs identiques, chacun possédant 8 registres FP64, 16 INT32 et 16 FP32, et 128 tensor cores (unités spécialisées pour optimiserles calculs sur l'IA et le Deep Learning), en sus d'un cache L0 et d'un scheduler, sans oublier le registre des files à traiter.
Cliquez pour agrandir !
Un GV100 comportera donc 5376 cœurs CUDA, la carte TESLA GV100 donc ne devrait pas employer toute la patate disponible. Cela fait 256 CC en moins ce qui correspond à 4 SM désactivés si on devait schématiser la chose. Le géant vert l'incorporera dans deux types de machines dites "clé en main", le DGX-1 qui aura 8 TESLA V100 pour la maudite somme de 149 000$, et le DGX Station qui en aura 4 pour 69000$, tout ça devrait être tiré en quantité limitée, TSMC ayant atteint semble-t-il ses limites avec son 12nm. Le caméléon quant à lui espère en vendre beaucoup pour rentabiliser les quelque 3 milliards dépensés pour la R&D pour Volta. On attend désormais des nouvelles de la version grand public qui sera bien plus orientée jeu avec abandon très probable des unités consacrées au GPU Computing, comme le fait NVIDIA actuellement entre ses puces Pro et Gaming, ce que n'arrive pas à faire AMD malheureusement pour les joueurs. Ces derniers voient des gains dans les jeux s'enfuir au profit d'unités de calcul réservées pour des activités secondaires.