COMPTOIR
register

L’avènement des PC IA, une aubaine pour NVIDIA ?

Cette semaine a été marquée par les annonces de Microsoft et Qualcomm ; des annonces centrées sur des ordinateurs portables faisant la part belle à l’intelligence artificielle grâce à l’association des processeurs Snapdragon X Series et de l’écosystème Windows Copilot+ PC. Les fondements de cette idylle ? La présence d’un NPU (Neural Processing Unit) relativement costaud au sein des puces susmentionnées. Pour le moment, ce mariage est assez exclusif, mais Microsoft a déjà affiché sa volonté de batifoler avec Intel et AMD à l’avenir, lorsque ces deux entreprises auront des processeurs dotés de plus gros NPU à présenter – la firme de Redmond mentionne explicitement Lunar Lake et Strix dans son communiqué.

Peu après cette union entre Microsoft et Qualcomm, Intel s’est ainsi rapidement manifestée pour présenter ses processeurs Lunar Lake, des puces fortement NPU-tées. AMD ne dit mot pour le moment, mais l’entreprise fera très certainement des annonces relatives à ses processeurs Zen 5 au cours des prochaines semaines.

Un grand absent de ce plan à quatre : NVIDIA. Pourtant, en matière d’IA, c’est la première entreprise à laquelle beaucoup de gens pensent. Elle n’a pas attendu les NPU pour intégrer des unités de traitement spécifiques à l’IA au sein de ses GeForce, et par extension se tailler une énorme part de marché sur ce secteur : les cœurs Tensor des GeForce RTX accélèrent déjà bon nombre de charges de travail IA – et ne parlons de son succès dans le secteur du HPC (pour sa plate-forme IA, NVIDIA avance plus de 500 applications et jeux supportés, par plus de 100 millions de PC et stations de travail RTX AI dans le monde). Bon, pour être tout à fait précis, Microsoft n’a pas totalement oublié les cartes graphiques dédiées ; la firme projette aussi des expériences Copilot+ « à l’avenir », avec « des cartes graphiques puissantes telles que NVIDIA GeForce RTX et AMD Radeon » ; mais apparemment, sous réserve qu’elles collaborent avec un NPU.

rtx windows ia pc

Quoi qu’il en soit, à défaut de commercialiser, à ce stade, des processeurs intégrant des NPU, NVIDIA continue de choyer ses GeForce. La société a publié un pilote R555 Game Ready qui optimise les performances IA dans plusieurs applications. En outre, au cours d’une interview, Jensen Huang n’a pas fermé la porte à l’arrivée de processeurs Arm NVIDIA l’année prochaine.

Un pilote R555 pour booster les performances IA des GeForce

Commençons parle nouveau pilote NVIDIA R555 Game Ready. Il apporte des optimisations qui ciblent en grande partie une gamme de LLM (Large Language Models) tels que Phi-3, Llama 3, Gemma et Mistral, lesquels alimentent les dernières avancées d'IA générative. Avec cette version R555, les GPU RTX délivrent des performances d'IA jusqu'à 3 fois plus rapides avec ONNX Runtime (ORT) et DirectML (deux outils utilisés pour exécuter des modèles d'IA localement sur les PC Windows), selon l’entreprise, qui revendique des gains sur l'ensemble des types de données INT4 et FP16.

llm inference perf

De plus, NVIDIA indique avoir optimisé les flux de travail IA au sein de WebNN - un standard qui aide les développeurs d'applications web à accélérer les modèles d'apprentissage profond avec des accélérateurs d'IA sur appareil, comme les Tensor Cores – afin d’apporter les performances des GPU RTX directement dans les navigateurs.

Par ailleurs, Microsoft et NVIDIA collaborent pour accélérer davantage les performances des GPU RTX via le support DirectML sur PyTorch. Concrètement, PyTorch va prendre en charge les backends d'exécution DirectML, ce qui permettra aux développeurs Windows d'entraîner et d'inférer des modèles d'IA complexes sous Windows de manière native.

Vous pouvez prendre connaissance de tous les ajouts sur le blog de NVIDIA.

Copilot+ et matériel NVIDIA

NVIDIA a profité de cette publication pour vanter les capacités IA de ses GPU. Déjà, la société rappelle un fait : elle revendique le lancement des premiers GPU PC avec accélération dédiée à l'IA – en l’occurrence, via la série des GeForce RTX 20 (Turing) dotées de Tensor Cores – ainsi que le premier modèle d'IA largement adopté pour fonctionner sous Windows, le NVIDIA DLSS, en 2018. Dans la guerre des TOPS, la société souligne aussi que ses derniers GPU délivrent jusqu'à 1 300 trillions d'opérations par seconde de performances dédiées à l'IA, là où les processeurs Intel / AMD / Qualcomm les plus rapides qui sortiront cette année plafonnent à 100 TOPS.

À propos de l’exploitation des fonctionnalités IA de Windows sur son matériel, NVIDIA écrit dans son communiqué : « Dans les mois à venir, nous sommes impatients de lancer des PC Copilot+ équipés d'un GPU RTX, offrant aux utilisateurs des performances accrues pour s'attaquer aux charges de travail IA locales exigeantes, ainsi que les nouvelles fonctionnalités Copilot+ de Microsoft ». Sur la base de cette formulation, seuls les appareils futurs semblent toutefois dignes d’être estampillés Copilot+.

Cependant, bien que le texte se borne à mentionner des PC équipés de GPU RTX, des rumeurs sur d’éventuels processeurs Arm NVIDIA destinés au segment grand public circulent depuis longtemps. Un article de Reuters évoquait encore cette ambition en octobre dernier. Cette semaine, dans le cadre d’une interview accordée à la Bloomberg Television, Michael Dell et Jensen Huang, respectivement PDG de Dell et de NVIDIA, ont plus ou moins confirmé les projets de cette dernière en la matière. À une question portant sur l’arrivée de « PC IA NVIDIA », les deux comparses ont botté en touche pour le moment, mais ils ont invité Ed Ludlow de Bloomberg à en reparler l’année prochaine.

Si l’on se limite aux faits, NVIDIA collabore actuellement avec Mediatek autour de SoC Dimensity pour le secteur automobile. À en croire les derniers ragots, les deux sociétés plancheraient également sur un processeur pour les consoles portables ; la société taïwanaise s’occuperait de la composante CPU, et NVIDIA de la composante GPU. Rappelons que NVIDIA travaille aussi avec Nintendo sur la Switch 2. Pour mémoire, la Switch actuelle mobilise un SoC NVIDIA Tegra X1 combinant cœurs CPU Arm et puce graphique Maxwell. Par ailleurs, la société propose déjà des processeurs « complets » pour les centres de données : les Grace Superchip.

Sur le papier, NVIDIA a toute les armes en main pour lancer des processeurs grand public Arm ; d’autant plus en collaborant avec MediaTek. Ajoutez à cela la nouvelle dimension prise Qualcomm avec ses Snapdragon X Series et les avancées de Windows-on-Arm qu’elle induit, et vous avez un alignement des planètes a priori plutôt favorable.

Un poil avant ?

DDR6 et LPDDR6 : les nouvelles générations accélèrent le rythme

Un peu plus tard ...

L’Asus ROG Ally X va envoyer du lourd : 24 Go de LPPDR5X-7500 et capacité de batterie doublée

À défaut de processeurs dotés de NPU, l’entreprise compte bien exploiter son parc de GeForce RTX, des cartes à la fois populaires et aptes à gérer de nombreuses charges de travail IA, pour tirer son épingle du jeu face à Intel et AMD.

temps de concentration afin de cerner l'ensemble des subtilités de ce billet à vue de nez disons heuu moins de 5 minutes

Sur le comptoir, au ~même sujet

 
 
 
 
 
 
 
 
 
 
 
 



Suivez-nous sur G.Actualités
Les 11 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par VISION4LIFE @ArtaX en Île-de-France, le Samedi 01 Juin 2024 à 11h25  
Les lunettes 3D n'ont jamais fait pschiit

helixmod.blogspot.com (nvidia 3DVision, DLP nvidia 3DVision)
mtbs3d.com (3D SDS - anaglyph - DLP nvidia 3Dvision etc...)

On n'en parle pas, c'est tout.

Et en ce qui concerne le cinema, c'est plus compliqué : seul l'IMAX apporte une plus-value. Et les salles ne courrent pas les rues.

Le casque Amazon Quest 2 et 3 marchent du tonnerre (même si je déteste les casques), et le casque de niche Pimax est une pièce d'orfèvre.
Bref, les casques, ça n'a jamais fonctionné car ça prend toute la tête, ça isole du monde et ça donne mal au crâne dans certains cas.
par JoW, le Samedi 25 Mai 2024 à 21h00  
par Jemporte, le Samedi 25 Mai 2024 à 11h58
lien
C'est déjà suffisamment parfait.
ah oui GPT4o, je l'ai testé, il n'est pas capable de lire une ligne d'un tableau envoyé en screenshot, comme je l'ai dis il y a encore du boulot. C'est bien d'avaler une conférence de presse et dire wouaaw c'est génial, alors que c'est pré-enregistré et essayé plusieurs fois avant que l'IA ne merde pas. De plus, il pourrait utiliser un modèle bien plus puissant pour leur démo pour ensuite faire un modèle bien moins performant pour le grand public.
par Jemporte, le Samedi 25 Mai 2024 à 11h58  
par JoW, le Samedi 25 Mai 2024 à 02h27
C'est déjà le cas dans les GAFAM qui licencient a tout va et même pour des entreprises non liés a la tech. Ça va desservir les affaires, parce que bon, les IAs c'est pas encore parfait (et peut-être le sera jamais), mais le gain en frais de main d'œuvre justifie tout dans notre économie...
lien
C'est déjà suffisamment parfait.
par Un ragoteur visionnaire embusqué, le Samedi 25 Mai 2024 à 11h20  
par Un ragoteur 'ArthaX' du Centre-Val de Loire, le Vendredi 24 Mai 2024 à 17h44
L'IA c'est un truc qui va faire pschiit,
.....
- La VR.
......
je ne pense pas que ça va faire pshiiit, mais comme la VR, en particulier la réalité augmentée, ça va être réduit dans le futur à des domaines précis ou la techonologie est utile et efficace.
Pour l'instant on est dans une bulle ou on colle de l'IA sur tout et n'importe quoi, comme toute bulle elle va éclatée, et l'IA sera restreinte là ou elle a une utilité avérée.
Disparaitre, non, mais être limitée aux domaines on elle apporte un plus important.

Avec openIA qui fait sauter tous les gardes fous pour rester le 1er dans la course, on va finir par se retrouver avec un Skynet au cul avec leurs conneries.
Et celles et ceux qui vont me répondre en me rigolant au nez que ça n'est qu'une série de films (les deux 1ers bons et les suites entre médiocres et mauvaises), prenons l'exemple d'Idiocraty qui au départ n'était qu'une satire humoristique imaginaire sur la bêtise humaine et devient de plus en plus une description de la réalité.
par JoW, le Samedi 25 Mai 2024 à 02h27  
par Jemporte, le Vendredi 24 Mai 2024 à 23h14
Il y a le pschiittt et il y a quand ça va te remplacer favorablement au boulot, ce qui, je peux t'assurer que ce sera le cas d'ici en gros 5 ans maxi. Du moins pour les boulots intellectuels, genre ingénieur, voir médecin (une soignante avec un logiciel IA de médecins à côté pour lui dire quoi faire ce sera suffisant et meilleur qu'un médecin en consultation). Un juge IA fera des jugements sans faille... Ceux qui perdront le boulot en dernier ce sont les métiers manuels, parce qu'un robot ça coûte plus cher qu'une puce dans un PC ou qu'un terminal connecté sur un serveur.
C'est déjà le cas dans les GAFAM qui licencient a tout va et même pour des entreprises non liés a la tech. Ça va desservir les affaires, parce que bon, les IAs c'est pas encore parfait (et peut-être le sera jamais), mais le gain en frais de main d'œuvre justifie tout dans notre économie...
par Jemporte, le Vendredi 24 Mai 2024 à 23h15  
par Un ragoteur des lumières embusqué¶, le Vendredi 24 Mai 2024 à 13h59
Je ne sais pas ce qu'on aura mais ça fait quelques années que j'espère un CPU Nvidia avec toute l'expertise qu'ils ont.
Couplé à un GPU RTX, j'espère qu'ils balayeront le X86 comme il se doit
Pour que tu paies plus pour une nouvelle archi fermée avec obligation de racheter du logiciel derrière ?
C'est vachement intelligent comme idée. ARM, Nvidia et autres Mediatek ou Qualcomm, ou même Apple doivent se frotter les mains.
par Jemporte, le Vendredi 24 Mai 2024 à 23h14  
par Un ragoteur 'ArthaX' du Centre-Val de Loire, le Vendredi 24 Mai 2024 à 17h44
L'IA c'est un truc qui va faire pschiit, et bien des gens vont investir pour rien. Perso c'est une des choses que je vais désactiver de mon PC.

Depuis un moment dans la tech, tout le monde se précipite pour tout et n'importe quoi :
- Les télés 3D avec leurs lunettes.
- Les voitures avec des piles à combustibles.
- Les voitures sans conducteurs.
- Les crypto monnaies.
- La VR.
- L'IA dans tout et n'importe quoi.

Alors que l'IA ne concerne que des domaines très limités. Je comprends que Microsoft est très effrayé par les NPU dans les SoC Apple, mais faut pas non plus être hystérique. Il faut travailler avec les fabricants de SoC, CPU et GPU en amont.

@++
Il y a le pschiittt et il y a quand ça va te remplacer favorablement au boulot, ce qui, je peux t'assurer que ce sera le cas d'ici en gros 5 ans maxi. Du moins pour les boulots intellectuels, genre ingénieur, voir médecin (une soignante avec un logiciel IA de médecins à côté pour lui dire quoi faire ce sera suffisant et meilleur qu'un médecin en consultation). Un juge IA fera des jugements sans faille... Ceux qui perdront le boulot en dernier ce sont les métiers manuels, parce qu'un robot ça coûte plus cher qu'une puce dans un PC ou qu'un terminal connecté sur un serveur.
par Un ragoteur 'ArthaX' du Centre-Val de Loire, le Vendredi 24 Mai 2024 à 17h44  
L'IA c'est un truc qui va faire pschiit, et bien des gens vont investir pour rien. Perso c'est une des choses que je vais désactiver de mon PC.

Depuis un moment dans la tech, tout le monde se précipite pour tout et n'importe quoi :
- Les télés 3D avec leurs lunettes.
- Les voitures avec des piles à combustibles.
- Les voitures sans conducteurs.
- Les crypto monnaies.
- La VR.
- L'IA dans tout et n'importe quoi.

Alors que l'IA ne concerne que des domaines très limités. Je comprends que Microsoft est très effrayé par les NPU dans les SoC Apple, mais faut pas non plus être hystérique. Il faut travailler avec les fabricants de SoC, CPU et GPU en amont.

@++
par Dylem, le Vendredi 24 Mai 2024 à 14h10  
Donc, en gros, une RTX 4080 à 800 TOPS aura besoin d'un NPU à 45 TOPS pour fonctionner?

D'accord.
par Un ragoteur qui pipotronne d'Occitanie, le Vendredi 24 Mai 2024 à 14h10  
par Un ragoteur des lumières embusqué¶, le Vendredi 24 Mai 2024 à 13h59
Je ne sais pas ce qu'on aura mais ça fait quelques années que j'espère un CPU Nvidia avec toute l'expertise qu'ils ont.
Couplé à un GPU RTX, j'espère qu'ils balayeront le X86 comme il se doit
Nul doute qu'on aura une puce tout en avec une partie ARM pour le CPU et un pendant de RTX mobile pour le GPU si ça doit arriver. Il y a que peu de doute qu'nVidia va essayer de frapper fort sur le marché du "PC IA" en 2025. Et que ça pourrait bien chambouler un peu Intel et AMD sur leur marché du portable/notebook.
par Un ragoteur des lumières embusqué 📱, le Vendredi 24 Mai 2024 à 13h59  
Je ne sais pas ce qu'on aura mais ça fait quelques années que j'espère un CPU Nvidia avec toute l'expertise qu'ils ont.
Couplé à un GPU RTX, j'espère qu'ils balayeront le X86 comme il se doit