COMPTOIR
register

Des Xeon Phi Knights Mill pour l'apprentissage automatique

Pour concurrencer les Titan et autres Tesla professionnels d'NVDIA, le géant bleu avait tenté de fabriquer ces propres cartes graphique, donnant lieu au projet Larabee. L'idée était alors simplement de rassembler un bon nombre de Pentium III sur une carte, moyennant adaptation, et marcher ainsi sur les plates-bandes des GPU rouges ou verts.

 

Sauf que tout n'est pas allé comme prévu : les performances en jeu étaient terriblement mauvaises, et le prototype est resté longtemps au placard. Finalement, le projet est revenu sous le nom de Intel Many Integrated Core Architecture ou Intel MIC, qui s'est transformé en Xeon Phi, dévoilé officiellement à la vente sous la référence Knight Corner en 2012. Depuis, une génération a passé : Knight Landing (Knight Hill, en 10 nm, ayant été annoncé puis annulé).

 

Désormais, la troisième génération a été lancée, sans aucune annonce officielle, qu'elle soit humaine ou digitale. Les plus complotistes y verront une anguille sous roche, mais la mise à jour est suffisamment mineure et restreinte à un marché de niche pour ne pas necessiter la motagne de tambours, trompettes et marketing habituelle. Globablement, la recette est toujours la même : 64, 68 ou 72 coeurs disponibles, un hyperthreading émulant 4 threads par coeurs (et donc 256 à 288 threads en tout !) pour un TDP de 250 à 300W. Les fréquences moulinent entre 1,3 et 1,5 GHz, le bouzin embarque 16 GB de HBM2 en sus des 32/34/36 mégot de L2 et de 8 cannaux de DDR4 (quelques 384 Go maximum sont supportés). La principale nouveauté réside dans le support de nouvelles extentions AVX512, notemment concernant la précision mixte particulièrement utilisée en machine learning.

 

Aucun prix n'est encore annoncé, mais cela doit assurément piquer ! A quand une intégration grand public pour ce type de monstre(Source : WikiChip.org et Anandtech)

 

intel knl 7210 anandtech

La génération précédente possédait déjà un très fort potentiel de kiktoudur !

 

Un poil avant ?

R5 2500U, le Ryzen basse consommation qui poutre?

Un peu plus tard ...

RX Vega custom : pourquoi elles sont si chères ?

Les 7 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Un #ragoteur déconnecté embusqué, le Mardi 26 Décembre 2017 à 11h39  
par chambolle, le Lundi 25 Décembre 2017 à 21h27
Avec 80 coeurs c'est peut etre different. Encore que j'en doute un peu.
Le profil logiciel n'est pas le même, donc c'est pas vraiment le fait qu'il y ait 80 cores qui rend le SMT "4x" plus pertinent, mais la cause sous-jacente est la même que l'augmentation du nombre de cores elle-même.
par chambolle, le Lundi 25 Décembre 2017 à 21h27  
par Xorg, le Vendredi 22 Décembre 2017 à 18h07
«un hyperthreading émulant 4 threads par coeurs»
D'ailleurs, pourquoi cette technologie n'existe pas dans les Xeon et Core ix ?
Il y aurait plus d'inconvénients que d'avantages, c'est ça ?
Mettre des threads c'est possible (d'ailleurs tu peux le faire si tu veux) mais les traiter correctement est beaucoup plus delicat. L'hyperthreading a été inventé pour ne pas attendre tout le temps (aller chercher un truc en memoire prend plein de cycles). Bien souvent 2 threads ca appaorte dans les 20-25% de perfs en plus quand ca se passe bien, donc en mettre 4 a peu d'interet sur une machine classique.

Avec 80 coeurs c'est peut etre different. Encore que j'en doute un peu.
par Un #ragoteur déconnecté embusqué, le Lundi 25 Décembre 2017 à 17h11  
Question d'économie d'énergie surtout : c'est pas si compliqué de présenter 4 threads au lieu de 2 (faut un "flag" à 2 bits au lieu d'un tout le long du pipeline), mais pour que ça ait un intérêt il faudrait des cores nettement plus capables, car si 2 threads permettent de limiter la formation de bulles, au-delà le gain serait dérisoire sans ça.
par Nicolas D., le Samedi 23 Décembre 2017 à 21h44  
par Xorg, le Vendredi 22 Décembre 2017 à 18h07
«un hyperthreading émulant 4 threads par coeurs»
D'ailleurs, pourquoi cette technologie n'existe pas dans les Xeon et Core ix ?
Il y aurait plus d'inconvénients que d'avantages, c'est ça ?
Je suppose également, le switch de contexte doit être trop coûteux sur les archi modernes pour chercher à davantage mutualiser. Ou alors le besoin ne s'en est pas fait sentir ?
par Jte Roule D3ssus, le Vendredi 22 Décembre 2017 à 20h38  
Curieux de connaitre les résultats en puissance de calcul, pas facile de battre une 1080GTX en GPGPU tant celle ci sont efficace et efficiente en calcul.

Et maintenant que Nvidia intègre des unités spécialisés pour le machine learning dans ses Titan V (110 Tflops ! ), les Xeon Phi vont faire très pale figure à coté.
par Xorg, le Vendredi 22 Décembre 2017 à 18h07  
«un hyperthreading émulant 4 threads par coeurs»
D'ailleurs, pourquoi cette technologie n'existe pas dans les Xeon et Core ix ?
Il y aurait plus d'inconvénients que d'avantages, c'est ça ?
par Un #ragoteur connecté embusqué, le Vendredi 22 Décembre 2017 à 17h31  
1 hyperthread pour 3 coeurs ? Windows aurait il du mal à compter