COMPTOIR
  
register

Du nouveau côté hardware chez... Tesla ?

Pour de la haute performance et des tâches de machine learning, les entreprises ont très souvent recours à du matériel de chez NVIDIA, principalement dû à son implication en recherche dans le secteur et la promotion de ses propres solutions maison. Pour autant, la concurrence existe, à la fois pour l’entraînement et l’inférence, avec du matériel spécialisé, par exemple chez Intel avec Habana’s Lab ; mais le nec plus ultra, c’est bel et bien de faire votre puce vous-même — la méthode Apple — afin de s’assurer que le cahier des charges colle pile-poil à ce que vous souhaitez. Cependant, cette solution n’est pas toute rose puisqu’il faut un sacré porte-monnaie pour cela ; mais ce n’est pas vraiment un problème pour Elon Musk, non ? Ainsi, nous ne sommes guère étonnés de voir Tesla aux Hot Chips 34 y aller de son accélérateur dédié à l’entraînement de DNN, nommé Dojo — une suite logique après ses premières puces, en 2019.

 

tesla dojo

Le Tesla V1 Dojo Interface Processor, intégrant 2 Dojo D1 et 32 Gio de HBM au format PCIe

 

Prévu pour peupler des racks entiers et ainsi former un supercalculateur exascale, Dojo est une architecture massivement parallèle, chaque puce étant composé d’un mesh de CPU au jeu d’instruction personnalisé et optimisé pour le machine learning. Chaque cœur possède 1,25 Mio de SRAM et intègre un pipeline offrant 2 unités de génération d’adresse pour 2 ALU, pas de système de protection de la mémoire ni de virtualisation histoire d’aller toujours plus vite, et un SMT à 4 threads/cœurs. Côté précision de données, le bousin est assez versatile avec le support du FP32, BFP16, CFP8, et CFP16.

 

Pour couronner le tout, les dies, nommés D1 sont gravés en 7 nm de chez TSMC (sans plus de précision) pour rassembler 354 cœurs dans 645 mm², soit 440 Mio de cache au total — de quoi offrir pas moins de 9 PFLOPS en BF16/CPF8. Par la suite, ces D1 sont également assemblés par packs de 5x5 pour créer une Dojo Training Tile, suivant également une organisation en mesh. Notez que l’intégration comprend également un système customisé d’alimentation et de refroidissement : à 600 W par die, cela vaut mieux !

 

Malheureusement, pour voir le beau en action, il faudra travailler chez la compagnie, car aucun plan de mise à disposition du matériel n’est prévu — pour des raisons évidentes de confidentialité, autant matérielle que logicielle. Avis aux amateurs ? (Source : Double ServerTheHome)

Un poil avant ?

Intel parle XeSS et Arc A770, mais oublie le plus important !

Un peu plus tard ...

Un écran OLED et pliable... de 45 pouces et pour les joueurs chez Corsair !

Que faire quand on a de l'argent et qu'on investit dans la conduite autonome ? Ho, du hardware !

temps de concentration afin de cerner l'ensemble des subtilités de ce billet à vue de nez disons heuu moins de 2 minutes

Sur le comptoir, au ~même sujet

 
 
 
 
 
 
 
 
 
 
 
 



Suivez-nous sur G.Actualités
Les 11 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Nicolas D., le Lundi 29 Août 2022 à 17h48  
par iarwain, le Dimanche 28 Août 2022 à 19h05
j imagine, ca doit etre des sacrés engins. Par curiosité, vous avez des photos? (si c est facile a trouver, je ne veux pas vous faire perdre du temps)
un petit lien tout mignon Tu trouveras ici à quoi ressemble le bousin une fois intégré en 5x5, avec son alimentation au-dessous. Impressionnant !
par lord Varices, le Lundi 29 Août 2022 à 06h28  
par iarwain, le Dimanche 28 Août 2022 à 19h05
j imagine, ca doit être des sacrés engins. Par curiosité, vous avez des photos? (si c est facile a trouver, je ne veux pas vous faire perdre du temps)
A ce stade on est plus sur du refroidissement individuel, on traite une pièce, c'est de l'ingénierie CVC.
par iarwain, le Dimanche 28 Août 2022 à 19h05  
par jumorolo, le Dimanche 28 Août 2022 à 11h06
les systèmes de refroidissement sont adaptés
j imagine, ca doit etre des sacrés engins. Par curiosité, vous avez des photos? (si c est facile a trouver, je ne veux pas vous faire perdre du temps)
par jumorolo, le Dimanche 28 Août 2022 à 11h06  
par iarwain, le Dimanche 28 Août 2022 à 06h28
Je suis stupide mais pas a ce point.

J y connais rien, mais j imagine que pour du matériel pro, on veut en mettre plein les uns a coté des autres. ce qui fait que la densité de production de chaleur doit etre tres elevée.
les systèmes de refroidissement sont adaptés
par iarwain, le Dimanche 28 Août 2022 à 06h28  
par jumorolo, le Vendredi 26 Août 2022 à 17h00
c'est pas un pc de gaming
Je suis stupide mais pas a ce point.

J y connais rien, mais j imagine que pour du matériel pro, on veut en mettre plein les uns a coté des autres. ce qui fait que la densité de production de chaleur doit etre tres elevée.
par Un ragoteur sans avis du Grand Est, le Samedi 27 Août 2022 à 19h01  
Par contre, 2 ALU par cœurs, ça me parait un peu léger pour aller nourrir 4 threads, non? Enfin, je suppose qu'ils savent ce qu'ils font.
par Un ragoteur sans avis du Grand Est, le Samedi 27 Août 2022 à 18h16  
par Supernaz, le Samedi 27 Août 2022 à 17h36
"un SMT à 4 threads/cœurs" => du coup pas de SMT en fait? Car j'ai compris 4 threads / 4 cores.
Ou alors il fallait comprendre "4 threads par coeur" ?
354 cœurs par die D1 = 1416 threads. C'est "une architecture massivement parallèle", avec 4 cœurs, ils n'iraient pas très loin
par Supernaz, le Samedi 27 Août 2022 à 17h36  
"un SMT à 4 threads/cœurs" => du coup pas de SMT en fait? Car j'ai compris 4 threads / 4 cores.
Ou alors il fallait comprendre "4 threads par coeur" ?
par Un ragoteur 'ArthaX' du Centre-Val de Loire, le Samedi 27 Août 2022 à 00h27  
J'ai vu pas mal d'offre d'emploi pour des codeur en Julia pour de l'IA.
Par contre pour le matériel, des SoC ARM embarquent des unités "neuronaux" pour justement donner aux personnes qui veulent tâter de l'IA.
Perso je dois avouer que ça me tente assez, d'autant qu"il y a des cartes abordable pour s'initier à l'IA. Il me semble que nVidia en propose deux sous les 150$ la carte.

@++
par jumorolo, le Vendredi 26 Août 2022 à 17h00  
par iarwain, le Vendredi 26 Août 2022 à 16h58
600Watts, c est des malades
c'est pas un pc de gaming
par iarwain, le Vendredi 26 Août 2022 à 16h58  
600Watts, c est des malades