Intel Architecture Day 2020 • Les nouveaux plans des bleus, 18 mois plus tard |
————— 13 Août 2020
Au centre de ce web-vènement se tenait Xe, l’entrée en grande pompe d’Intel dans la cour des grands GPU. Tout d’abord, reprenons les choses depuis les transistors : cette architecture sera la première grand public à quitter en partie les fonderies bleus pour pouvoir également être produite en externe, que l’on imagine facilement être TSMC. Cela concernera Xe HPG, la branche gaming basée architecturalement du Xe HPC, elle-même branche haute-performance pour centre de calcul à laquelle se rajoutera un sacro-saint accélérateur de Ray Tracing. Pour en revenir à Xe HPC, une partie des puces utilisera également des gravures ne provenant pas de la maison-mère. Au vu de cette complexité, un petit schéma n’est pas de refus :
Pour le reste des produits, Xe LP, déjà aperçu avec le DG-1, reste en 10 nm SuperFin maison, et se complète avec le SG1, une version pour PC professionnels, et l’iGPU de Tiger Lake. Bien que tous soient basés sur un circuit identique (nous y comprenons, un unique die, bien qu’Intel reste peu clair à ce sujet), les TDP et connexions annexes seront différentes, de quoi fournir des performances supérieures sur les cartes dédiées : ouf !
Il ne reste alors que Xe HP, une version située entre l’entrée de gamme LP et le très haut de gamme HPC, dont Intel n’a pas encore communiqué de spécificités. Le but reste identique à ce que la firme avait annoncé : réutiliser des blocs logiques communs afin de réaliser une architecture scalable, c’est à dire capable de se décliner via de multiples produits pour coloniser les segments allant des TFLOPS aux PFLOPS.
Trêve de stratégie, et place aux blocs logiques. Déjà annoncée dans l’Intel DG1, Xe sauce Low Power fera aussi son entrée dans l’iGPU de Tiger Lake (l’occasion de mentionner l’absence totale de Rocket Lake de la conférence). Sans surprise, le bousin se base énormément sur la Gen11 d’Ice Lake, ce pour quoi nous vous invitons à relire notre papier la décortiquant, disponible par ici.
Par rapport à cette fameuse Gen11, Xe se paye le luxe de grandir d’un facteur 1,5, en intégrant 96 Execution Units (EU) au lieu des 64 maximum des i7-10XXG7. Le cache L3 passe désormais à 3,8 Mio contre 3 Mo sur la Gen11, et les Subslices évoluent également pour se munir d’un cache L1-D, qui sera commun à 16 EU. Notez que, selon les modèles, la capacité de L3 pourra grimper jusque 16 Mio : largement de quoi donner à manger au EU supplémentaires.
Pour ce qui est du reste du pipeline, les unités de texturing offrent désormais un débit de 48 Textels/clock, et le back-end permet d’envoyer 24 pixels par tour d’horloge histoire du supporter la puissance nouvelle des EU.
En effet, ces dernières évoluent, et pas qu’un peu : auparavant composée de 4 ALU capables de calculer chacune une opération (voire deux pour les multiplications-addition) par cycle, ce chiffre grimpe à 8, ce qui double la vitesse de traitement en INT16, INT32 tout en n’oubliant pas l’INT8 — nous sentons ici une inclinaison au machine learning. Pour les fonctions plus complexes, c’est une autre partie de l’EU qui sera à l’œuvre, à savoir l’EM (Extended Math), capable de supporter deux opérations par cycle.
Ce n’est pas tout : en multipliant le nombre d’EU Intel en a profité pour mutualiser certains composants et ainsi gagner de la place. De cette manière, la partie chargée du contrôle des threads est partagée entre deux EU, ce qui offrira moins de flexibilité dans la programmation de la carte, sans pour autant restreindre cela par rapport aux autres architectures de la concurrence.
Enfin, passons aux normes supportées par ce Xe LP : avec 4 pipelines d’affichage, il sera possible de gérer du DisplayPort 1.4, de l’HDMI 2.0, des flux par Thunderbolt 4 ou encore USB Type-C. La HDR est bien évidemment de la partie, tout comme l’Adaptative-Sync (le FreeSync/G-Sync standardisé sauce VESA), et les aficionados de hautes fréquences seront aux anges avec des écrans pouvant monter à 360 Hz.
Que serait en 2020 un GPU sans sa partie d’accélération des flux vidéos ? Pas grand-chose, c’est pour cela qu’Xe en est également pourvu, et richement. Possibilité d’accélération de l’AV1 en décodage, des flux HDR en 4K et 8K, ainsi que l’encodage sur bon nombre de formats populaires... Pour le streaming comme pour la visualisation, Intel a vu les choses en avance.
Côté performances, Xe serait à la Gen11 ce que Tiger Lake est à Ice Lake : une capacité bien meilleure à monter en fréquence, et une consommation bien plus faible à fréquence égale. Du mal à se représenter la chose ? Pas de panique, voilà un graphique :
Intel nous a bien gratifiés d’une démonstration, mais sans compteur d’image par seconde ! Ralentie 10 fois, il était clair que Xe s’en sortait bien mieux que son aîné, malgré une enveloppe thermique à son désavantage (25 W vs 15 W)... Mais rien ne vaudra les benchmarks indépendants. Pour se risquer à quelques chiffres, avec 1,5 fois plus d’EU et une fréquence grimpant à 1,8 GHz, cela représenterait 32 opérations (16 FPU/INT en multiplication-addition, réalisant ainsi 2 opérations flottantes par cycle) x 96 cœurs x 1,8 GHz = 5,529 6 TFLOPS très exactement. Notez qu’Intel communique sur 1536 flops/clock pour son bousin, ce qui correspondrait à notre calcul sans prendre en compte les multiplications-additions, pourtant présentes sur la Gen11 : cela signifierait que ces FMA seraient uniquement possibles que sur les unités de math avancées, portant la puissance brute à seulement 2 764 TFLOPS. Attendons donc les spécifications officielles des cartes pour nous prononcer définitivement, sachant de toute manière que les FMA se destinent en priorité aux applications de machine learning et de calcul scientifique plus qu’aux jeux vidéos.
Comme toute entreprise expérimentée réalisant du matériel, Intel est bien conscient qu’un composant matériel se doit d’avoir une partie logicielle soignée. L’Intel Graphique Control Center (IGCC) avait déjà reçu de nombreux patchs afin de le rendre plus ergonomique, hé bien la chose devrait se poursuivre, voire s’accélérer avec la mise à disposition des pilotes directement via cette interface. Rien de bien nouveau par rapport au GeForce Experience ou au pilote AMD, d’autant plus que Windows sait désormais mettre à jour les drivers tout seul, mais la fonctionnalité se devait d’être disponible. Des fonctionnalités gadgets comme la possibilité de se diffuser directement sur Twitch ou YouTube seront également de la partie afin de plaire à la clientèle la plus jeune.
Qui dit driver dit également optimisations pour les jeux, et, à ce titre, Intel semble également avoir prévu les choses en amont. Les nouvelles technologies comme le CPS (Coarse Pixel Shading, permettant de modifier la résolution de rendu en fonction de l’élément de la scène affichée, déjà présentée à la première Architecture Day) seraient intégrées dans des futurs jeux tels GRID, de quoi permettre une augmentation de 25 % maximum du taux d’images par seconde. Citons également la présence d’effets de post-process faisant étrangement penser à AMD FidelityFX — bien que, sans démonstration, la comparaison soit délicate — et vous obtenez un bousin qui semble, sur le papier toujours, proposer de sérieux arguments face à la concurrence bien établie.
Pour ce qui est des autres segments, Intel a été moins riche en information. Cependant, nous savons que les tiles (blocs logiques vus précédemment) probablement gravées chacune sur un die, peuvent être combinées ensemble, très probablement à la manière des chiplets, afin de proposer des puces renfermant une puissance de calcul bien supérieure sur le même IHS, et ce, à destination des professionnels. Il n’est pas encore clair à ce jour si Xe HPG — la déclinaison joueur — bénéficiera d’assemblage similaire ; mais Raja Koduri a bien fait savoir que Xe HPC et Xe HPG seraient a minima différenciés par la VRAM embarquée : HBM pour le premier, GDDR6 pour le second. Comme quoi, la douloureuse expérience Fiji/VEGA a laissé des traces !
|
Un poil avant ?Des anciens employés de chez Intel dénoncent des potentiels soucis internes | Un peu plus tard ...Qnap compte upgrader votre PC en 2.5 GbE avec sa QXG-2G1T-I225 ! |