Composé par
Le comptoir
————— 12 Avril 2021 à 16h22 —— 23896 vues
C’est donc aujourd’hui que débutera le salon GTC, encore une fois virtualisé pour cause de pandémie. Ce sont pas moins de 1200 conférences qui seront délivrées sur la durée du truc, et c’est aujourd’hui à 17 h 30 heure d’Astérix — même si personnellement c’est Obélix qui a la préférence de votre serviteur — que Jensen va faire la sienne. Qui a tué la RTX avec Samsung dans la salle de bain ? Certainement pas le boss vert puisque c’est encore une fois dans sa cuisine qu’il fera le show. La grande question qui trotte partout, c’est qu’est-ce qui sera dit ?
Ce salon, en général, ne sert pas de lampe de rancement rampe de lancement pour des produits grand public, c’est plutôt des orientations dans le domaine de l’IA, de la médecine, de l’automobile qui y sont dévoilées, si vous attendez un refresh gaming, il faudra attendre sûrement longtemps pour plusieurs raisons. La première, c’est que les RTX actuelles se vendent très bien, et que les stocks sont à zéro en continu. Ensuite, parce qu’il y a une pénurie, la demande reste forte sur la durée, synonyme de ventes assurées. Et enfin, parce que ça fait peu de temps que les Ampere sont lancées, et donc aucune raison d’accélérer la chose.
Cartes graphiques pour les professionnels ? Chiplets ? HBM ? Ou tout simplement débrief d’une année pleine de rebondissements et autocongratulation en masse ? Venez suivre cette conférence avec le Comptoir, nous nous chargerons de déchiffrer ensemble les petits plats mitonnés par le Big Boss de la firme, a. k. a Jensen Huang, armé de son traditionnel blouson en cuir dans cette "kitchen keynote" — COVID oblige — probablement un peu moins sérieuse que les précédentes... ou pas ?
Si Ton Tuyau est bouché, n’hésite pas à appeler Mario !
Récapitulatif du keynote :
- 17 h 15 : Guillaume sort sa nouvelle édition du BXkaké du four, pensant imiter Jensen.
- 17 h 17 : L’odeur fétide qui s'en dégage l’envoie illico par la fenêtre, la rédaction part à la recherche du caf'ericsson, un bon moyen de développer son réseau
- 17 h 20 : Radio verte aux commandes pour 10 minutes d’attente : vous aimez la pop ?
- 17 h 21 : La RTX 4090, une carte à 8 ventilateurs, quad slots et alimentation 3-pin directe est officielle, pour un doux tarif de 5000 $
- 17 h 25 : Ah, Pascal a trouvé d'où provenait l'odeur du gâteau de Gui² : un poisson gros comme le watercooling de Nicolas s'y était glissé, plus précisément vers 17 h 21
- 17 h 28 : Matt' arrive avec un film et un morceau de haut moteur signé Luc Besson. La rédaction, ébahie, cherche à comprendre.
- 17 h 29 : "Bah quoi, on n'avait pas dit qu'on décortiquerait (l'arbre à) cames à Léon ?"
- 17 h 30 : Second passage d'un objet inutile par la fenêtre du bureau. Fort heureusement, aucun autre blessé que l'égo de son propriétaire.
- 17 h 31 : Gros plans sur une structure en billes. Le lustre de Jensen ? Notre spécialiste Ikéa est sur le coup.
- 17 h 32 : Ah non, c'est une vue de l'esprit d'un créateur (de plafonniers ?). Suite sur une séquence émouvante sur une floppyée de projets (probablement) sponsorisée par la firme.
- 17 h 34 : "I am IA" : le créateur est en fait une personnification de l'intelligence artificielle et de ses applications.
- 17 h 35 : Tonton Jensen est devenu, pendant le confinement, Papy Jensen. Le Comptoir parie sur le temps avant sa calvitie totale.
- 17 h 36 : NVIDIA va parler - en vrac - d'ARM, de nouvelles puces, de machine learning ... appétissant ?
- 17 h 37 : NVIDIA continue d'optimiser sa pile logicielle même après la sortie des produits menant à des accélérations même sans changement de puce... Bien que ce dernier soit largement conseillé !
- 17 h 39 : Retour sur les origines de la firme : le rendu 3D, vu comme une simulation de la réalité. Retour sur les benchmarks déjà vus, notamment Metro Exodus - coucou le Ray Tracing ! -, ainsi que de nouveau projets en cours : Boundary, un spin-off sur Wukong ou encore Bright Memory.
- 17 h 42 : NVIDIA récapitule Omniverse, une plateforme de collaboration virtuelle composée de plusieurs sous-parties, lancée en décembre : Nucleus pour le partage de ressources entres utilisateurs, une partie pour l'assemblage, le rendu et l'animation des créations. Enfin CloudXR se charge de la VR/AR, bien entendu accéléré par IA.
- 17 h 46 : NVIDIA est en partenaire avec WPP, une agence de communication britannique à rayonnement mondial. C'est chouette pour eux, mais pour nous...
- 17 h 48 : Toujours plus de simulations physiques sous un son de quasi-dubstep. Une piqûre de rappel pour PhysX, désormais en ruine ?
- 17 h 50 : Omniverse permet de faire fonctionner des industries virtuelles afin de simuler divers composants : cadence de production, agencements internes, ...
- 17 h 52 : NVIDIA a collaboré avec BMW pour réaliser une usine virtuelle pleine de mots-clefs qui attirent les investisseurs : IA, digitalisation (vive les doigts !), machine learning.
- 17 h 53 : L'usine virtuelle permet de contrôler d'éventuels problèmes de robots liés à l'automatisation ; mais aussi les mises à jour système ou encore la logistique.
- 17 h 56 : Les partenaires d'OmniVerse sont légion : Adobe, ASUS, hp, Lenovo, ...
- 17 h 57 : Les serveurs sont passés d'un design monolithique (une application / serveur ou rack) à un modèle virtualisé, puis distribué. L'ajout de (GP)GPU pour le machine learning a encore empiré la complexité, d'où l'intervention des verts pour proposer une puce, BlueFiled, sécurisée, rapide et prévue dès la conception pour la vitualisation.
- 17 h 59 : Bluefield se programmera avec la plateforme DOCA, annoncé aujourd'hui.
- 18 h 00 : Bluefield 3 est annoncé, avec 16 coeurs ARM Cortex-A78 et 22 milliards de transistors.
- 18 h 02 : Bluefield 4 est également dans les cartons, de quoi prévoir une évolution des performances d'un facteur 100 sur les 3 ans qui ont suivi la sortie du premier modèle.
- 18 h 02 : Switch de Jensen sur la série DGX, intégrant les NVIDIA A100 : Superpod, A100 ou Station A100
- 18 h 05 : Mais une nouvelle DGX A100 station est disponible, avec 2,5 PETAFLOPS de puissance brute pour 1500 W... et un refroidissement liquide. Néanmoins, ces unités se branchent uniquement sur une prise standard, tout comme une grosse station de jeu.
- 18 h 06 : Notre rédacteur de Hardware Porn, Matt' est aux anges devant autant de design poli.
- 18 h 07 : Un nouveau SuperPod est également annoncé, avec 90 Tio de HBM 2 (en tout), des A100 à 80 Gio, des cartes Bluefield 2, et le système Base Command des verts.
- 18 h 08 : Est-ce vraiment surprenant de parler d'applications machine learning pour cela ? Le LSTM, des réseaux de neurones à mémoire, sont particulièrement dans le viseur de par l'évolution de nouvelles méthodes d'entrainement, permettant par exemple le design de code directement à parti d'images - reste à voir la qualité de cela.
- 18 h 09 : NVIDIA présente Megatron, un système d'organisation de tâches permettant l'inférence de réseaux de neurones distribuée sur plusieurs GPU, une chose encore jamais faite jusqu'alors.
- 18 h 10 : Toujours plus de logiciels sont dévoloppés / aidés par NVIDIA permettant d'appliquer le machine learning à la médecine, particulièrement sur la génomique et la recherche moléculaire. Le COVID est bien entendu en toile de fond des présentations !
- 18 h 12 : le supercalculateur Bio-Live de Recursion permet d'accélérer la découverte de nouveaux médicament. Cette machine est la plus puissante dans son genre... pour le moment !
- 18 h 13 : Nouveau switch de contexte pour le Papy, qui passe sur l'info quantique. On droppe par-ci par-là des mots scientifiques. Les Q-bits permettent de résoudre des problèmes NP-difficile en temps polynominal comme le TSP (travelling saleman problem). Pas sûr que tout le monde saisisse, mais ça fait classe.
- 18 h 15 : NVIDIA annonce cuQuantum, une bibliothèque permettant d'accélérant grandement la simulation de systèmes quantiques, particulièrement sur des cartes de la firme. DGX est en embuscade au tournant ! L'idée est de stimuler la recherche en algorithmique, encore trop freinée par le manque de puissance de calcul des ordinateurs quantiques existants. Pourquoi pas, mais cela ne remplacera sûrement pas une vraie machine quantique.
- 18 h 17 : NVIDIA a un souci de goulot d'étrangement : le PCIe, même 4.0 (ou 5.0 ?) n'est pas suffisant pour autoriser une exécution faisant usage de toute la puissance de calcul GPU.
- 18 h 19 : Les verts proposent Grace : un CPU désigné par NVIDIA, proposant un facteur 30 en matière de communication CPU GPU.
- 18 h 20 : Jensen-Mélenchon déclenche son plan "Hologramme" et remballe sa cuisine virtuelle pour passer en voix off.
- 18 h 21 : Grace sera un design à base de plusieurs clusters CPU, chacun relié à un cluster GPU. La topologie n'est pas encore connue, mais il est clair qu'une sacrée expertise sera nécessaire pour exploiter correctement les 2000 Gio/s de bande passante annoncée !
- 18 h 23 : Graviton, un serveur de l'Amazon Web Service, est en partenariat avec NVIDIA pour fournir toujours plus de puissance, en particulier pour les jeux mobiles, un marché juteux de jeu Android dans le cloud.
- 18 h 24 : D'autres partenariats sont en cours : Marvell et Mediatek, histoire de déployer les technologies vertes dans toujours plus de bidules et de domaines.
- 18 h 26 : NVIDIA cherche à populariser l'IA auprès du grand public, et pas seulement pour les chercheurs en informatique.
- 18 h 27 : NVIDIA AI rassemble tous les outils de machine learning de la firme : cuDNN, cuGraph, TensorRT, CUDA, DOCA, etc... utilisés sur tous les serveurs cloud accélérés par des cartes NVIDIA.
- 18 h 29 : Cette pile logicielle est désormais adaptée pour la virtualisation, en particulier pour VMWare Enterprise, évitant les ralentissements habituels sans sacrifier la sécurité. Bien évidemment (et cela n'est pas rappelé), les licences de virtualisation sont payantes !
- 18 h 30 : Une nouvelle carte PCIe est annoncée par le caméléon : Aerial A100 : capable de délivrer des flushs à 20 Gbps, la 5G accélérée par ML en ligne de mire.
- 18 h 31 : Avec Fujitsu, Ericsson est également partenaire de ce projet. Nous vous l'avions bien dit (#complot) !
- 18 h 32 : NVIDIA annonce Morpheus, un moyen de conserver l'intégrité de la Matrice des pirates Neo. Basé sur de machine learning, le logiciel permet de monitorer les comportements suspects et informe les administrateurs des potentielles failles de sécurité au cours de la gestion d'un parc informatique.
- 18 h 35 : Google est également dans le coup avec Google Cloud. On n'a pas trop compris pourquoi ni comment, mais les deux doivent probablement collaborer.
- 18 h 36 : NVIDIA sort sa mitraillette à références : StyleGAN, Minecraft, Sim2Real, SimNet, BioMegaTron, 3DGT, OrbNet... la recherche appliquée est au coeur des préoccupations de la firme.
- 18 h 37 : NVIDIA propose également des modèles de réseaux de neurones préentrainés par des professionnels pour différentes applications. Néanmoins, certaines données sont sensibles, voire confidentielles, c'est pourquoi la firme a planché sur des méthodes de transfert learning permettant de modifier légèrement les modèles originels afin de s'adapter à la tâche précise requise. Tout cela est inclus dans NVIDIA Fleet Command et NVIDIA TAO - un condensé de sagesse orientale ! S'en suit une démonstration dans différentes usines, principalement automobiles, dans laquelle la topologie des pièces de l'usine entravait le réseau initial. Un clic et "magie", telle Joséphine Ange Gardien, le réseau s'adapte et les erreurs disparaissent. Épatant ?
- 18 h 41 : NVIDIA lance NVIDIA JARVIS, un framework d'application de machine learning pour les conversations en anglais, français, japonais, russe et espagnol. Capable d'être déployé dans le cloud sur des stations DGX, le logiciel sera disponible en test pour qui voudra à partir de mai.
- 18 h 44 : JARVIS est lié à Mozilla Voice pour ses enregistrements, permettant d'utiliser les utilisations de la communauté pour son entraînement personnel.
- 18 h 45 : "The more you buy, the more you save" : les poncifs de la firme ne sont pas oubliés !
- 18 h 48 : Maxine permettra de rassembler de nombreuses application accélérées par IA pour améliorer vos communications vidéo : traduction en temps réel, correction du regard, sous-titrage et traduction, et, surtout, compression intelligente et reconstruction du flux vidéo.
- 18 h 52 : NVIDIA Triton est le nom du moteur d'inférence de NVIDIA, permettant de rassembler différents back-end (Tensorflow, Pytorch, TensorTR) sous une seule égide.
- 18 h 53 : Matt vient de noter que la veste de Jensen a changé. Une victime collatérale du confinement ?
- 18 h 54 : NVIDIA est profondément impliqué dans l'IA pour l'automobile autonome, construisant au fur et à mesure les outils requis.
- 18 h 54 : Orin est annoncé, une puce dédiée à l'automobile, permettant de gérer à la fois l'autopilotage (par IA), mais aussi l'ordinateur de bord et les fonctionnalités annexes de divertissement. Ces puces sont rassemblées dans une plateforme nommé Hyperion AV, rassemblant tout ce qu'il faut pour une automobile autonome - en tout cas dans les plans des verts.
- 18 h 57 : La prochaine puce pour la conduite autonome se nomme NVIDIA DRIVE ATLAN, fusionnant Bluefield avec des fonctionnalités d'accélération IA. Jensen parle d'un investissement sur l'avenir : le prix du bousin doit atteindre des sommets, mais cela n'empêche pas Mercedes, Volvo, Hyundai et Audi de s'équiper. Notre Big Boss voit déjà des taxis autonomes d'ici peu de temps, bienvenue dans Cyberpunk !
- 18 h 59 : Retour du tournage de la boucle bouclée avec Omniverse, qui permet... de simuler les modèles de conduite autonome des voitures, évitant ainsi des coûteux et potentiellement dangereux tests en live.
- 19 h 03 : Récapitulatif de cette keynote, définitivement bien dense : NVIDIA a lancé un bon tas de trucs, et a bien des partenaires de partout dans l'industrie. Pas un mot, par contre, sur l'état de la production et de la pénurie... Espérons que cela ne douchera pas trop les ardeurs de la firme !