COMPTOIR
register

Intel fait une démonstration d'un Broadwell-EP avec FPGA intégré

Le SC16 (Supercomputing 2016) est terminé, c’est un lieu où se déroulent des conférences et démonstrations sur des sujets comme la haute performance, le computing, le réseau, le stockage et l'analyse, bref ça envoie du bois. Dans le lot des présents, on trouvait Intel qui a racheté Altera il y a un peu moins d'un an, pour rapidement sortir le Stratix 10 à la suite. Voilà pour le contexte, passons à nos moutons et discutons processeur pour serveur. Comme vous le savez, les bonds en performance ne sont plus aussi impressionnants qu'avant, donc il faut bien trouver de nouvelles idées et c'est ce que l'on va voir à présent.

 

intel 2016 idf china slide 24

 

Durant cette démo, Intel a montré en action un Xeon E5 intégrant un FPGA Altera Arria 10, insistant d'ailleurs copieusement sur le fait que l'on n'avait pas affaire à deux entités distinctes, mais bien une seule et unique. En début d’année, il était noté que la partie CPU intégrerait quinze cœurs et que pour en arriver à une telle intégration, il était nécessaire d’utiliser plusieurs phases, une première nécessitant de placer la partie FPGA sur le même package que le CPU, puis de les fusionner pour en obtenir un seul élément. Le géant bleu a débuté ses travaux dès l’acquisition d’Altera puisque la bête utilise l’architecture Broadwell, et non pas Skylake (qui arrivera dans la seconde moitié de 2017, décalage grand public/serveur).

 

intel xeon arria10 package

 

À présent, parlons performance, le géant bleu a montré comment ce duo pouvait permettre un gain en performance sur des tâches bien précises, en effet, les FPGA sont des puces reprogrammables et dans le cas d’Intel, elles sont utilisées comme des accélérateurs sans qu’il soit nécessaire d’en acheter ou d’en développer un en parallèle, réduisant ainsi les coûts et avec une consommation revue à la baisse. La démo utilise Apache Spark (un framework dédié au traitement des Big Data), on obtient une base de performance de 100% lorsque le FPGA est inactif, tandis que lorsqu'il est actif, les performances augmentent pour atteindre un peu moins de 150%.

 

intel xeon e5 arria10 benchmark apache spark

Le graphique en bas à gauche montre le gain obtenu à l'activation du FPGA.

 

Cette démonstration montre que du côté des serveurs, des gains intéressants sont encore possibles (dans un usage bien spécifique), de plus, la technologie est concrète puisque des samples d'essai ont été envoyés, afin qu'ils soient utilisés par les développeurs et par certains utilisateurs en avant-première. Du côté du grand public, on peut se demander si on verra arriver ce genre de duo au sein de nos processeurs et si oui, avec quel gain à la clé ? (Source : diverses)

Un poil avant ?

Une GTX 1070 aux couleurs d'une équipe d'eSport ? La iGame GTX 1070 Snake X-Top de Colorful

Un peu plus tard ...

La réalité virtuelle vous branche ? Venez l'essayer au Comptoir ou à côté de chez vous

Les 7 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Un ragoteur de transit d'Ile-de-France, le Mardi 22 Novembre 2016 à 21h51  
par Jame patagueul le Lundi 21 Novembre 2016 à 19h16
Sincèrement, je vois pas trop en quoi ça démontre un intérêt pour ce truc là ?
En gros on a 10 coeurs X86 et on rajoute X coeurs ARM et on constate une augmentation de performances.
Si je rajoute 4 cylindres à ma voiture elle sera plus puissante oui.
Ce qu'il aurait fallu c'est démontrer que 2 coeurs X86 = 1 coeur ARM par exemple. là on aurait vu l'intérêt du FPGA.
Qu'est ce qui vous indique que le FPGA a été programmée pour avoir le comportement de cœur ARM ?
Je ne sais pas quel était l'application visée dans la démo mais pour du traitement d'image il aurait été possible de programmer le FPGA pour qu'il puisse effectuer des transformées de Fourrier ou des muladd (multiplication suivie d'une addition).
par Un ragoteur de transit d'Ile-de-France, le Mardi 22 Novembre 2016 à 21h47  
Est ce que le FPGA et le CPU partage le même espace d'adressage comme c'est le cas chez IBM avec les Power8 ???

Qu'en est-il de la combinaison du FPGA avec les SIMD (Single instruction Multiple Data, des instructions permettant de faire un traitement, comme une addition, sur plusieurs registres, ceci permet d'accélérer par exemple des multiplications de matrice) ?
par Un rat goth à l'heure embusqué, le Mardi 22 Novembre 2016 à 01h45  
La démo est clairement pourrie (46% de gain c'est très mauvais), mais le concept n'en est pas moins valable.

Reste que le FPGA gagnerait fortement à être placé en guise de front-end du CPU (le fameux microcode en est pas un d'ailleurs?), car là peu importe le blabla il n'est selon toute vraisemblance qu'un "accélérateur" interfacé en PCIe caché sous le même bout de cuivre...
par Jame patagueul, le Lundi 21 Novembre 2016 à 19h16  
Sincèrement, je vois pas trop en quoi ça démontre un intérêt pour ce truc là ?
En gros on a 10 coeurs X86 et on rajoute X coeurs ARM et on constate une augmentation de performances.
Si je rajoute 4 cylindres à ma voiture elle sera plus puissante oui.
Ce qu'il aurait fallu c'est démontrer que 2 coeurs X86 = 1 coeur ARM par exemple. là on aurait vu l'intérêt du FPGA.
par UpsiloNIX, le Lundi 21 Novembre 2016 à 18h51  
Perso je suis prêt à mettre mes jetons sur le fait que dans quelques années les développeurs de soft devront/pourront ajouter une partie vhdl dans leur logiciel qui reprogrammera le FPGA à la volée pour le soft en question.
par Scrabble, le Lundi 21 Novembre 2016 à 17h50  
C'est bien ce que je pensais, le bon vieux CPU à tout faire a fait son temps, maintenant c'est le matériel plus ou moins spécialisé pour une tâche particulière. Zen sera probablement le dernier représentant de son espèce.
par Et paf le ragot ! de Rhone-Alpes, le Lundi 21 Novembre 2016 à 17h37  
Même si ce genre de processeur arrive sur le grand public, cela n'aura jamais aucun intérêt pour celui ci tant que l'utilisation ne sera pas concordante avec les besoins du public visé, soit madame michu, voir même un gamer, ou pro basique.
Comme le dit l'article, ses processeurs qui coute très cher en plus sont destinés aux serveurs performants et pas au reste.
Tant que les programmes courant de tout les jours ne profiteront pas de cette amélioration possible de performance, aucune utilité pour le public et ce n'est malheureusement pas prêt de changer!!!
Si un jour, cela change on verra bien.