COMPTOIR
  
register

Des infos sur les prochains EPYC Zen 4 Genoa-X et Bergamo

L'info n'est pas officielle. On sait par une roadmap AMD, que Genoa-X arrivera en 2023, souvenez-vous, ce sont les puces EPYC  basées sur Zen 4 en 5 nm, et épaulées par de la mémoire 3D V-Cache. La sphère Twitter a répertorié les 4 références qui devraient être lancées. En haut, on retrouve du 96 coeurs et 192 threads, comme Genoa, mais avec 768 Mo de cache en plus des 384 Mo de L3. Le reste est constitué par des CPU de 16 à 32 coeurs, et donc de 32 à 64 threads, conservant malgré tout les 768 Mo de cache.

 

Mais ce n'est pas tout, Bergamo également fait son apparition sur ces fuites. Pour rappel, c'est la génération identique à Genoa mais spécialisée Cloud, avec du Zen 4 gravé en 5 nm, mais il n'ets pas impossible que ça vire au 4 nm qui reste de la même famille que le 5 nm, juste une optimisation. Ce gain d'espace devrait permettre de caler encore plus de coeurs sur un CPU EPYC ayant les mêmes dimensions. La légende dit même qu'en haut de la série Bergamo se cache un CPU qui aurait 128 coeurs et 256 threads. Nous avons fait un tableau récapitulatif, incluant les TDP. Avec autant de trucs dedans, ils sont forcément élevés, de 320 à 400 W en piochant dans ces deux gammes à venir.

 

EPYC (B ou G)Coeurs/threadscache (Mo)frequences (GHz)tdp (W)
9754 (B) 128/256 256 2.05/3.2 360
9734 (B) 112/224 256 2/3.0 320
9684X (G) 96/192 1152 pouet 400
9384X (G) 32/64 1152 paf 320
9284X (G) 24/48 1152 ploc 320
9184X (G) 16/32 1152 pwaloq 320

 

Forcément, ça envoie du pâté, et ça ne risque pas de faire les affaires d'Intel, lui qui est déjà en retard avec Sapphire Rapids, et qui va devoir se palucher deux générations violentes. Pour autant, ce qui fait aussi la différence sur ce segment, c'est la logistique, le suivi, et la mise en oeuvre de moyens pour assurer les réparations et la maintenance. À ce jeu, Intel a une grosse expertise, mais AMD a lui aussi évolué avec des plateformes solides et fiables.

 

amd epyc processeur

Un poil avant ?

Intel vante ses cartes Alchemist Arc... En attendant mieux

Un peu plus tard ...

Bon Plan • Epic Games tombe sous le charme de Lara dans les ombres, et vous l'offre gratuitement !

Les 8 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Un hardeur des ragots en Île-de-France, le Vendredi 02 Septembre 2022 à 17h13  
par Un ragoteur sans avis du Grand Est, le Jeudi 01 Septembre 2022 à 19h24
J'imaginais aussi des blocs et fonctionnalités un peu annexes, comme le SMT ou l'AVX, et peut-être quelques jeux d'instructions un peu optionnels mais demandant des circuits spécialisés, non? Mais bon, pour le coup, il se dit qu'ils auraient l'intention de garder les 2 (smt et avx).
Le SMT est peu coûteux en transistors, et est très profitable quand le back-end a des unités qui se tourne les pouces.
Le Pentium 4, en raison de son pipeline énorme, induisant des erreurs de branchement très coûteux, en bénéficiait bien.
L'Atom était très simple (in-order, pipeline court, peu d'unités), mais bénéficiait énormément du SMT pour une autre raison : le front-end était in-order, ce qui faisait qu'il peinait à alimenter le back-end à 100%.

Pour l'AVX, il ne s'agit que d'instructions : les processeurs traduisent le code machine dans un langage interne, spécifique au CPU : il s'agit d'amener les bonnes données dans la bonne unité d'exécution, pour faire le calcul correspondant. Tout cela est micro-codé, ça ne coûte pas tant que cela d'en rajouter (l'AMD64 est déjà énorme et bouffi).
Ensuite, du côté unité de calcul, la FPU est généralement tronquée, comme je l'avais déjà écrit. Elle fait moins de calculs par cycle, ou demande plus de cycles pour faire la même opération. Cette FPU, c'est précisément ce qui sert à exécuter l'AVX, le SSE, etc.
par fkanker, le Vendredi 02 Septembre 2022 à 04h57  
par Un ragoteur sans avis du Grand Est, le Jeudi 01 Septembre 2022 à 19h24
J'imaginais aussi des blocs et fonctionnalités un peu annexes, comme le SMT ou l'AVX, et peut-être quelques jeux d'instructions un peu optionnels mais demandant des circuits spécialisés, non? Mais bon, pour le coup, il se dit qu'ils auraient l'intention de garder les 2 (smt et avx).
Le SMT prend très peu de place. Sur Zen 4, AVX-512 est toujours sur des unités en 256 bits (2 cycles) : ils ne gagneraient rien à le supprimer.
par Pipotronator, le Jeudi 01 Septembre 2022 à 20h06  
AMD semble cette fois capable de débiter du CPU chez TSMC, donc si c'était le maillon faible de la chaine sur la génération précédente, les parts de marché serveur vont peut-être monter plus vite en 2023 que sur 2022.
par Un ragoteur sans avis du Grand Est, le Jeudi 01 Septembre 2022 à 19h36  
Ah quoique. D'après les documents, Bergamo garde une quantité de L3 identique par CCD. C'est juste le fait que le nombre de cœurs double que la quantité de cache/cœurs diminue.
par Un ragoteur sans avis du Grand Est, le Jeudi 01 Septembre 2022 à 19h24  
par Un rat goth à l'heure en Auvergne-Rhône-Alpes, le Jeudi 01 Septembre 2022 à 18h14
Dans les SoC ARM, domaine que je connais bien, le principal facteur de gain en densité est en effet la troncature du cache L2.
C'est claire que lorsque l'on regarde Zen 3, on voit tout de suite sur quoi rogner, si on veut faire de la place et qu'on n'est pas focalisé sur des perfs/cores phénoménales
Par contre du coup, vu que le L2 augmente avec Zen 4, si ils ne comptent pas le re-rogner sur Zen 4c, ils auront finalement autant de L2 que de L3

 
Ensuite, les économies se font sur le front-end (comme le sous-système mémoire est moins performant, le cœur passe plus de temps à attendre : on peut réduire la fenêtre de réordonnancent), et enfin sur le back-end (on met moins d'unités en parallèle, car le front-end va donner moins de travail à faire) (c'est toujours la FPU qui trinque en premier).

J'imaginais aussi des blocs et fonctionnalités un peu annexes, comme le SMT ou l'AVX, et peut-être quelques jeux d'instructions un peu optionnels mais demandant des circuits spécialisés, non? Mais bon, pour le coup, il se dit qu'ils auraient l'intention de garder les 2 (smt et avx).

 
Pour le moment, Intel et AMD suivent la même approche.

Pas vraiment. Intel, lui, utilise ses cœurs mobiles pour les LITTLE, qui avec le temps ont évolué bien différemment de leur homologues desktop, non?
AMD, lui, opterait pour des cœurs derniers cris pour ses big, et de cœurs castrés de l'année précédente pour ses LITTLE (les 8000 en Zen 5 + Zen 4c, les 9000 probablement en Zen 6 + Zen 5c, etc...). Même architecture que l'itération précédente, mais rabotés de partout.
par Un rat goth à l'heure en Auvergne-Rhône-Alpes, le Jeudi 01 Septembre 2022 à 18h14  
par Un ragoteur sans avis embusqué, le Jeudi 01 Septembre 2022 à 12h24
Pour Bergamo, c'est surtout la décapitation par 2 du L3 qui permet d'en caser 16 par chiplets (et peut-être d'autres trucs dans le core, allez savoir...). Mais le N4 aidera aussi, c'est certain.
Dans les SoC ARM, domaine que je connais bien, le principal facteur de gain en densité est en effet la troncature du cache L2. Ensuite, les économies se font sur le front-end (comme le sous-système mémoire est moins performant, le cœur passe plus de temps à attendre : on peut réduire la fenêtre de réordonnancent), et enfin sur le back-end (on met moins d'unités en parallèle, car le front-end va donner moins de travail à faire) (c'est toujours la FPU qui trinque en premier).
Pour le moment, Intel et AMD suivent la même approche.
par fkanker, le Jeudi 01 Septembre 2022 à 12h51  
Le N4/N4P n'offre que 6% de densité supplémentaire par rapport au N5. C'est toujours bon à prendre, mais c'est surtout le design qui fait le boulot à ce stade. Par contre les 22% d'efficacité énergétique du N4P en plus par rapport au N5 sont très intéressants.
par Un ragoteur sans avis embusqué, le Jeudi 01 Septembre 2022 à 12h24  
Pour Bergamo, c'est surtout la décapitation par 2 du L3 qui permet d'en caser 16 par chiplets (et peut-être d'autres trucs dans le core, allez savoir...). Mais le N4 aidera aussi, c'est certain.