Une "petite" optimisation améliore grandement les performances CPU pour le Machine Learning

La réception • Actualités • Processeurs

Généralement le Deep Learning - une sous catégorie des algorithmes d'apprentissage - est plus efficace sur des GPGPU, voire des puces dédiées, car les calculs matriciels qui en découlent sont fortement parallélisables. Cependant il est souvent plus simple (ou moins couteux pour les résultats préliminaires) de les faire tourner sur un simple CPU, ce qui a l'inconvénient de prendre bien plus de temps.

Cette époque serait bientôt révolue : des accélérations matérielles telles que l'utilisation des instructions AVX et de l'Intel Math Kernel Library ont permis (selon Intel) des améliorations allant de 10x à 72x sur des Xeon Phi (la première tentative d'Intel de s'installer dans les clusters de calculs manycores), et 5x à 20x sur des Xeon Broadwell (avec une machine de test à 22 coeurs tout de même !).

Les bibliothèques concernées sont Caffe et Tensorflow, si vous les utilisez dans leur version "optimisée CPU", mais également d'autres projets tels Torch, dont une branche CPU est sous développement par le fondeur de Santa Clara ou encore Theano et Neon (rien à voir avec les instructions ARM). Bien que certaines optimisations remontent à l'été dernier, The Next Platform a répertorié les outils concernés et les impacts sur les performances : NVIDIA, leader du domaine, pourrait bien avoir du souci à se faire !

machine learning brain

Un poil avant ?

220 sites font déjà du mining en coulisses !

Un peu plus tard ...

Un 3è moniteur Optix chez MSi

Multiplier ses performances par 72 ? C'est possible grâce à Intel, sur certains processeurs seulement.

1 minute

Sur le comptoir, au ~même sujet

	Test • Intel Core i9-13900K, Core i7-13700K, Core i5-13600K & Z790
	Test • Intel Core i9-14900K, Core i7-14700K & Core i5-14600K
	Test • Intel Nuc 9 extreme Kit - NUC9i9QNX & Mastercase NC100
	Test • Intel Nuc 12 extreme Dragon Canyon
	Test • Intel NUC10i5FNKPA2
	L’Intel Baseline Profile diminue d’environ 9 % les performances du Core i9-14900K
	La fin des grille-pains chez Intel ? Arrow Lake-S n'est pas meilleur mais chauffe moins que Raptor
	Core i9-14900KS : Intel persiste dans la surenchère de GHz et de watts
	Intel milite désormais en faveur d'ordinateurs plus écolos
	200 milliards de transistors en monolithique chez TSMC à l'horizon 2030 (comme Intel)
	Intel et AMD désormais partenaires, pour le bien du x86
	x86 : le choc de simplification d'Intel, ce ne sera pas pour tout de suite