COMPTOIR
  
register

Avec 150 MW à la pompe, xAI Colossus peut faire fonctionner ses 100 000 GPU simultanément

Au même titre que les fermes de minage, le développement des centres de données IA implique une demande croissante d’énergie. En témoigne le cas xAI Colossus, la « Gigafactory of Compute » d’Elon Musk. En début de mois, la TVA (pas la taxe prélevée par l’état qui gonfle la facture de vos achats, mais la Tennessee Valley Authority) a validé l’accord qui permet au site de pomper plus de 150 mégawatts,  puissance nécessaire pour faire fonctionner de concert les 100 000 GPU H100.

xcolossus ithome

Un centre glouton

Cette installation est située à Memphis. Toute entreprise utilisant plus de 100 mégawatts doit obtenir l'approbation de la TVA ; elle a donc finalement été délivrée pour xAI Colossus le 7 novembre dernier (soit quelques heures après l'élection de Donal Trump ; libre à vous de faire un rapprochement).

Au départ, le xAI Colossus n’avait accès qu’a 8 MW provenant du réseau. Afin de contourner cette limite, xAI (l'entreprise spécialisée dans l'IA créée par Elon Musk en juillet 2023) avait fait venir 14 générateurs mobiles de Voltagrid, ce qui lui avait permis d’obtenir environ 35 MW supplémentaires (grâce à des générateurs à gaz naturel CAT 3520 sur roues qui fournissent 2,5 MW chacun).

Jeudi dernier, la TVA a donc approuvé une demande d'un accord de puissance supérieure à 100 mégawatts avec la CTC Property LLC, une société affiliée à xAI. Cette autorisation permet à xAI de se connecter aux systèmes de TVA et de MLGW (Memphis Light, Gas and Water).

Vous l’imaginez, les locaux et défenseurs de l’environnement ne voyaient pas ce raccordement d’un très bon œil. D’autant plus que fin octobre, Musk a fait part de sa volonté d’atteindre 200 000 GPU Grace Hopper d'ici peu.

Concrètement, l’installation nécessite 4,9 millions de litres d'eau par jour pour être refroidie. En outre, les moyens qui devront être mis en œuvre pour produire l’électricité supplémentaire inquiètent les habitants.

Le site DCD rapporte les propos d’Amanda Garcia, avocate principale au Southern Environmental Law Center :

Nous sommes alarmés par le fait que le conseil d'administration de la TVA ait approuvé la demande d'énergie de xAI sans étudier l'impact qu'elle aura sur les communautés locales. L'année dernière, TVA a remis en question la fiabilité de l'énergie et a proposé une nouvelle usine de gaz polluants à South Memphis. Aujourd'hui, les membres du conseil d'administration ont exprimé leur inquiétude quant à l'impact des grands utilisateurs industriels d'énergie sur les factures d'électricité dans toute la vallée du Tennessee. TVA devrait donner la priorité aux familles plutôt qu'aux centres de données comme xAI ».

L’article ajoute que des des militants ont déjà critiqué l'impact du projet sur la qualité de l'air. KeShaun Pearson, président de Memphis Community Against Pollution, a résumé : « [...] nous méritons un air pur, pas un asphyxie silencieuse ».

Cela n’a donc à l'évidence pas suffi à convaincre les membres du conseil d'administration de TVA, puisqu’ils ont donné leur feu vert à MLGW pour fournir l'énergie supplémentaire. Nous vous passons la déclaration complète. Dans les grandes lignes, c’est en mode « nous avons pris en compte vos inquiétudes, mais nous essayons de concilier vos craintes avec la nécessité de fournir des emplois et de recevoir des investissements, blablabla ; nous nous engageons à fournir à tous nos clients une énergie abordable et fiable ».

De son côté, xAI s'est engagée à construire le plus grand système de membranes céramiques au monde pour traiter ses eaux grises, et d’installer des batteries de stockage Tesla Megapack à prix réduit afin d’améliorer la stabilité du réseau électrique de Memphis. La société va également investir 24 millions de dollars dans une nouvelle sous-station électrique. Doug McGowen, PDG de MLGW, a déclaré précédemment que xAI serait en mesure de réaliser ce projet plus rapidement et à moindre coût que MLGW (DTC précise que xAI recevra des remises mensuelles de la part de la compagnie d'électricité jusqu'à ce que ses coûts soient récupérés et que MLGW devienne propriétaire de la sous-station).

Visite des entrailles de la bête

Pour revenir à des considérations plus basiques, NVIDIA nous avait envoyé un communiqué le 29 octobre annonçant que « le cluster de supercalculateurs Colossus de xAI, a atteint une échelle massive intégrant 100 000 GPU NVIDIA Hopper Tensor Core, grâce à la plateforme de mise en réseau Ethernet NVIDIA Spectrum-X ». Le document ajoutait que « ce supercalculateur de pointe a été construit par xAI et NVIDIA en 122 jours seulement, au lieu des délais habituels pour les systèmes de cette taille qui peuvent prendre plusieurs mois, voire plusieurs années. Il s'est écoulé 19 jours entre le moment où le premier rack a été installé et le début de la production ».

Si vous souhaitez en découvrir davantage sur l’infrastructure, le plus simple est de visionner la séquence ci-dessous proposée par nos confrères de ServeTheHome. Elle est titrée Inside the World's Largest AI Supercluster xAI Colossus.

Un poil avant ?

Solidigm et Phison dégainent des SSD de 122 To, tandis que Micron cible le 60 To

Un peu plus tard ...

MSI réagit aux cas des Ryzen 7 9800X3D flambés

Les 7 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Jemporte, le Lundi 09 Décembre 2024 à 23h58  
par Un ragoteur ZADiste embusqué, le Mercredi 20 Novembre 2024 à 13h44
150MW pour 100 000 GPU, ça fait l'équivalent de 1500W par GPU.
pour chaque GPU ça fait environ 400W pour le GPU et 1100W pour le refroidissement et la backbone de l'architecture, ça me parait énorme, ça fait 1 bloc de clim pour maison individuelle pour 3 GPU
D'abord on sait pas si ce sont pas des H100 NVL par deux justement dédiés AI, donc des double H100 mais 350W par GPU, ou même des H200.
parce que récemment, on parle dans des articles que Musk veut porter de 100 000 à 200 000 son centre mais en H200. Il se pourrait donc que ce soit déjà des H200, donc justement des double H100, et j'ai pas entendu parler de NVL dans ce cas. Du coup on est bien à 700W par GPU H200.
A noter que les réglementations écolos, toutes, avec l'arrivée de Trump, vont sauter aux Etats-Unis au niveau fédéral, complètement, et donc les états qui les maintiendraient vont être particulièrement lésés à côté de leur voisin qui les lèvera, et donc en principe tous les états pas trop masochistes vont le faire.
Du coup les Californiens vont retrouver de l'eau en été, les centrales charbon vont redémarrer et le nucléaire va refaire surface avec la techno française des surgénérateurs Astrid, rachetée par Bill Gates, avec tous les experts français qui allaient avec.

par Un ragoteur ZADiste embusqué, le Mercredi 20 Novembre 2024 à 13h44  
150MW pour 100 000 GPU, ça fait l'équivalent de 1500W par GPU.
pour chaque GPU ça fait environ 400W pour le GPU et 1100W pour le refroidissement et la backbone de l'architecture, ça me parait énorme, ça fait 1 bloc de clim pour maison individuelle pour 3 GPU
par Jemporte, le Samedi 16 Novembre 2024 à 01h40  
Ben voyons. La TVA c'est pour la Time Variance Authority.
par neelrocker, le Jeudi 14 Novembre 2024 à 22h30  
Le Cerveau d'acier (Colossus: The Forbin Project)
Film à voir
par Le boucher des potins des Hauts-de-France, le Jeudi 14 Novembre 2024 à 20h48  
L'IA peut être très utile. Mais elle est très énergivore, et elle ne peut rien faire que des humains ne peuvent pas faire. Dans un projet de transition écologique, où l'on s'efforce de réduire les émissions de gaz à effet de serre et de favoriser la sobriété énergétique, alors ça serait une évidence : l'Humanité n'en a pas besoin. Mais je crains que la transition écologique ne soit plus à l'ordre du jour, aux Etats-Unis pas plus qu'en France. Comme toujours, on favorise la performance, "quoi qu'il en coûte" y compris la fragilisation du tissu économique, pourvu que les profits soient là. Un jour se lèvera et les IA se féliciteront d'avoir augmenté le chiffre d'affaire des entreprises qu'elles administrent, alors que les humains auront disparu.
par Scrabble, le Jeudi 14 Novembre 2024 à 20h30  
par ragoteur politeur embusqué, le Jeudi 14 Novembre 2024 à 19h08
Avec Trump qui va sortir les USA des accords de Paris et relancer toutes les énergies sales pas chères on sait comment sera l'avenir.
Avec les démocrates américains hypocrites comme pas deux on savait aussi comment sera l'avenir, et c'est le meme qu'avec Trump
par ragoteur politeur embusqué, le Jeudi 14 Novembre 2024 à 19h08  
Avec Trump qui va sortir les USA des accords de Paris et relancer toutes les énergies sales pas chères on sait comment sera l'avenir.
Mais au moins son super pote Musk pourra faire tourner ses serveurs à fond, et continuer à troller et poster de la m*rde sur TwitterX.
Une bonne entente entre milliardaires sans morale.
Après le MAGA il aura ce pour quoi il a voté, pour quatre ans de douleurs dans le fondement sans vaseline.