Tesla V100s : une révision de Volta façon "SUPER" pour les professionels |
————— 27 Novembre 2019 à 09h40 —— 11840 vues
Tesla V100s : une révision de Volta façon "SUPER" pour les professionels |
————— 27 Novembre 2019 à 09h40 —— 11840 vues
La Tesla V100 n'est ni un GPU de salon ni de chambre (m'enfin, vous faites ce que vous voulez, hein), mais une carte PCIe sans ventilation embarquant un GV100 de la famille architecturale Volta, accessoirement une énorme puce de 815 mm² et 21,1 milliards de transistors lancée au GTC 2017, une éternité ! C'est au salon Supercomputing 2019 - l'un des événements par excellence pour tout ce qui touche au HPC et les superordinateurs - que la V100s avait commencé à montrer discrètement le bout de son museau dans les machines et documentation mise à disposition par certains intervenants, et elle avait alors été confirmée à plusieurs reprises par des fabricants comme étant bel et bien une nouvelle référence à venir, alors même que Jensen Huang n'en a touché mot durant sa présentation de près de 2 heures.
En tout cas, l'évolution s'annonçait déjà assez mineure et visuellement la V100s se distinguait par son accent doré, au lieu de vert sur la V100. En fin de compte, il ne fallut pas attendre bien longtemps pour que la carte se matérialise officiellement chez NVIDIA.
MODèLE | NVIDIA V100 (PCIe) |
NVIDIA V100 (SMX2) | NVIDIA V100s (PCIe) | AMD Radeon Instinct mi60 |
---|---|---|---|---|
GPU |
GV100 12 nm TSMC |
GV100 12 nm TSMC |
GV100 12 nm TSMC |
Vega 20 7 nm |
Interface | PCIe 3.0 x16 | SMX2 | PCIe 3.0 x16 | PCIe 4.0 x16 |
Architecture | Volta | Volta | Volta | GCN 5.1 |
Fréquence Base / Boost | 1230 / 1530 MHz |
1297 / 1530 MHz |
? / 1601 MHz | 1200 / 1800 MHz |
Shaders / TMU / ROP / SMU - CU / Tensor |
5120 / 320 / 128 / 80 / 640 | 5120 / 320 / 128 / 80 / 640 | 5120 / 320 / 128 / 80 / 640 | 4096 / 256 / 64 / 64 / NA |
Mémoire / Fréquence |
16 / 32 Go HBM2 / 876 MHz |
16 / 32 Go HBM2 / 876 MHz |
32 Go HBM2 / 1106 MHz |
16 / 32 Go HBM2 / 1000 MHz |
Bus mémoire | 4096-bit | 4096-bit | 4096-bit | 4096-bit |
Bande passante | 900 Go/s | 900 Go/s | 1134 Go/s | 1024 Go/s |
Cache L2 | 6144 Ko | 6144 Ko | 6144 Ko | 4024 Ko |
Alimentation | 2 x 8 pins | 2 x 8 pins | 2 x 8 pins |
1 x 6 pins 1 x 8 pins |
TDP | 250 W | 250 W | 250 W | 300 W |
Performance FP16 | 28,0 TFLOPs | 30,4 TFLOPs | 32,8 TFLOPs | 29,5 TFLOPs |
Performance FP32 | 14,0 TFLOPs | 15,7 TFLOPs | 16,4 TFLOPs | 14,7 TFLOPs |
Performance FP64 | 7,0 TFLOPs | 7,8 TFLOPs | 8,2 TFLOPs | 7,4 TFLOPs |
Ça coûte ? | une p'tite blinde (oui, on a eu la flemme de chercher) ! |
Points d'évolutions notables côté GPU, si ce n'est qu'il devrait mouliner un peu plus haut, mais il n'est pas à écarter que NVIDIA ait également effectué quelques petites optimisations. Même son de cloche pour la mémoire HBM2, qui voit également ses fréquences monter d'un cran et cela vaut donc aussi pour la bande passante disponible en hausse de 234 Go/s. Toujours est-il que cette petite croissance permet à la nouvelle carte d'offrir mieux que la version SMX2 de la V100, en sachant que la V100s ne sera disponible pour l'instant que sous la forme d'une carte PCIe.
Il est peut-être dommage que NVIDIA n'en ait pas profité pour y intégrer la dernière norme PCIe 4.0, ce que la Radeon Instinct MI60 propose depuis son lancement en novembre 2018, cette dernière avait également été le premier GPU a être gravé au bon 7 nm de chez TSMC. Néanmoins, la V100s suffit pour remettre les pendules à l'heure avec sa concurrente Radeon et les vraies évolutions technologiques sont donc encore pour plus tard, soit avec Ampere ou Hopper !