COMPTOIR
  
register

×

Fusion CCX

Test • Zen 3 : Ryzen 9 5950X & 5900X / Ryzen 7 5800X / Ryzen 5 5600X
Fusion CCX
Hiérarchie des caches
Topology à un CCD
Topology à 2 CCD
Evolution Zen
Load/Store
Load/Store

• Un CCX par die, et pis c’est tout !

Le grand chambardement dans l’organisation interne des cœurs Zen 3, réside dans le passage à des CCX de 8 cœurs. Contrairement à Zen 1 & 2, qui devaient caler 8 cœurs selon une topologie 4 + 4 sur le die contenant les cœurs, liant ainsi le L3 (toujours de type victime) par l’Infinity Fabric, cette limitation disparaît au profit d’un plus "simpliste" 1x 8 cœurs par die.

 

Fusion CCX [cliquer pour agrandir]

 

Deux effets se font alors sentir : d’une part, la synchronisation des 16 Mo de cache L3 entre CCX — par rapport à Zen 2 — n’a plus lieu d’être, ce qui devrait franchement améliorer les performances multithread des applications gourmandes en bande passante RAM. Et ce d’autant plus que l’implémentation au sein de Zen 2, faisait passer les communications entre CCX d'un même die par la puce distincte gérant les entrées/sorties (cIOD). Le progrès est donc de taille. D’autre part, un programme monothread pourra désormais utiliser pleinement les 32 Mo de L3 présents sur le die, alors que dans le cas de Zen 2, les 16 Mo accompagnant chaque CCX étaient privés à ce dernier. Autant dire que les gains devraient, ici aussi, être au rendez-vous. La fusion ne s’effectue par contre pas sans inconvénient : la latence d’accès au L3 augmente fatalement de 39 à 46 cycles, bien que ce ne soit pas nécessairement visible : sur Zen premier du nom, cette valeur était encore plus basse, avec 35 cycles seulement.

 

Hiérarchie des caches [cliquer pour agrandir] 

Au passage, la macro-organisation reste identique : un die nommé cIOD s’occupe des entrées/sorties et de la connexion entres cœurs de calcul regroupés au sein de dies nommés CCD, abritant chacun le CCX (à présent unique). Les CCD demeurent donc indépendants (permettant une meilleure granularité des coûts de production avec un seul type de die quelque soit le niveau de performance recherché), leur liaison avec le cIOD étant toujours confiée à l’Infinity Fabric, sauce Die-to-Die, c’est-à-dire en utilisant directement les couches conductrices du substrat. Cette non-innovation permet ainsi de conserver intact le cIOD, qui est toujours produit en 12 nm chez GlobalFoundries. Pour les processeurs qui nous intéressent aujourd'hui, l’AM4 reste de mise, et la compatibilité avec les chipsets série 500 et 400 assurée, si tant est que les fabricants mettent à jour les BIOS. Semi-déception pour les plus rêveurs, car cette série ne pourra pas pointer à plus de 16 cœurs sur le segment desktop, il vous faudra une fois de plus vous tourner vers les Threadripper pour cela. 

 

Topology à un CCD [cliquer pour agrandir]

 

Pour les CPU équipés de 8 cœurs ou moins, l’IHS cachera une organisation du type du schéma ci-dessus, et pour les processeurs à 12 et 16 cœurs, c’est au-dessous qu’il faut regarder.

 

Topology à 2 CCD [cliquer pour agrandir]

  

Les chiffres ne changent pas par rapport à Zen 2 : chaque CCX accède à la RAM selon un débit montant de 16 o/cycle et 32 o/cycle en descendant, sachant que la bande passante des CCX est limitée par le cIOD du fait de l’interfaçage avec le contrôleur mémoire unifié. Notez qu’une configuration à deux CCD risque ainsi de saturer le contrôleur mémoire, expliquant de potentielles irrégularités de performances entre les différentes gammes sur certains benchmarks. A contrario, le débit d'un seul et unique CCD à direction du cIOD, ne permet pas de tirer partie de l'intégralité du bus mémoire. Côté cache, les bandes passantes de 32 o/cycles sont par contre bidirectionnelles, et, concernant la communication avec les périphériques, cette dernière s’effectue sur un bus séparé à raison de 64 o/cycle.

 

Evolution Zen [cliquer pour agrandir]

 

Alors qu’Intel avait profité de Sunny Cove pour muscler son L1 et le passer à 48 ko, AMD est resté sage sur le reste de ses caches : seule la Store Queue, le buffer utilisé pour rassembler les éléments à ranger à nouveau en L1, prend du galon, et passe de 48 à 64 entrées.

 

Load/Store [cliquer pour agrandir]

 

Pour transmettre les données du L1 à l’intérieur du cœur, AMD a dopé son sous-système mémoire. Rattaché à la partie s’occupant des calculs entiers (les chargements mémoire sont effectués à partir d’adresses, qui ne sont rien d’autre que des entiers 64 bits), ses bandes passantes explosent, avec la possibilité d’effectuer un chargement ou un rangement de plus par cycle, soit 3 opérations maximum, dont au plus 2 stores. Attention par contre, dans le cas d’utilisation des instructions AVX (utilisation de vecteurs de 256 bits), le processeur devra se contenter 2 chargements et 1 rangement, ce qui donnera des performances similaires à Zen 2. Du côté de la table des pages, les caches restent identiques avec un L2 à 2048 entrées, mais, surtout 4 page walkers supplémentaires, pour un total de 6. Ces composants servent à parcourir la mémoire allouée pour trouver la bonne entrée correspondante. Une évolution qui suit donc assez logiquement l’élargissement de la bande passante mémoire, et devrait masquer les latences dues aux accès chevauchant deux pages.

 

Load/Store [cliquer pour agrandir]

 

Tout cela est bien beau, mais comment le CPU peut-il utiliser efficacement ces données nouvellement acquises ? La réponse page suivante, dans la dissection complète des unités de calcul d’un cœur Zen 3.



Un poil avant ?

Du SSD RGB, encore ? Eh oui, avec le T-FORCE TREASURE Touch !

Un peu plus tard ...

Windows Insider 20251 : toujours plus de rustines pour Windows 10

Les 201 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par mart666, le Samedi 16 Octobre 2021 à 15h16  
Comment ça avec le 5950x handbrake utilise max 40-50% du cpu ? (utilisation totale du cpu ne dépasse pas 57%)

Pour profiter à 100% de mon achat je dois encoder 2 films en même temps pour atteindre 100% du cpu ?
par Eric B., le Samedi 06 Mars 2021 à 09h39  
Le risque effectivement en voulant synchroniser tous les coeurs à une fréquence donnée stable : on en arrive à des situations ou un tâche requérant moins de parallélisme tourne à des fréquences plus élevées par défaut. Console toi en te disant que de toute façon à part être (très) chanceux sur la qualité de sa puce ou sortir l'artillerie lourde, l'overclocking sur les CPU récents est peu probant, les constructeurs ayant "mangé" une bonne partie de la marge avec Precision Boost, CPU Boost, TVB, etc.
par Un champion du monde en Provence-Alpes-Côte d'Azur, le Samedi 06 Mars 2021 à 09h02  
par Eric B., le Samedi 06 Mars 2021 à 08h47
C'est le problème de l'overclocking, cela reste une loterie selon la qualité du silicium que l'on touche. La température devient effectivement rapidement problématique sur des die aussi petits, c'est pourquoi nous avons utilisé un AIO 360 pour limiter cet impact, mais malgré tout elle s'est avérée limitante dans certains cas. Le mieux dans ta situation est d'accepter de sacrifier quelques MHz afin de baisser la tension d'alimentation, ce qui aura un effet très positif sur la puissance et donc la température.
Merci Éric, j'ai essayé mais curieusement mon score est moins élevés en 1.3v 4.350ghz(ryzen master) que par défaut.... Sous timespy CPU score, va comprendre....
par Eric B., le Samedi 06 Mars 2021 à 08h47  
C'est le problème de l'overclocking, cela reste une loterie selon la qualité du silicium que l'on touche. La température devient effectivement rapidement problématique sur des die aussi petits, c'est pourquoi nous avons utilisé un AIO 360 pour limiter cet impact, mais malgré tout elle s'est avérée limitante dans certains cas. Le mieux dans ta situation est d'accepter de sacrifier quelques MHz afin de baisser la tension d'alimentation, ce qui aura un effet très positif sur la puissance et donc la température.
par Un champion du monde en Provence-Alpes-Côte d'Azur, le Vendredi 05 Mars 2021 à 21h53  
Difficile pour moi de tenir les 4,7 GHz du 5600x sur tout les côtés avec AMD Ryzen master à 1.4 volt sur un noctua nh d15 et bequiet 500dx soit les perfs via timespy CPU score tombe soit sous occt en salle data extrême constant CPU plante à cause de la température, pourtant le timespy dans la phase CPU test est stabilisé à 83 degrés..., Un avis ?
cm MSI b550 Tomahawk, memory 3600 cl16 Crucial 2x 16 GB, bios a50 stable.
par Un ragoteur qui pipotronne en Nouvelle-Aquitaine, le Dimanche 31 Janvier 2021 à 18h32  
Bonjour,
concernant l'écart de fréquence en full load pour le 5600x (encart en bas de la page 5), je constate également cet écart avec le mien.
je suis également sur une carte mère msi, et plus précisément la b550 gaming plus.
Mon constat est que la carte mère "exagère" la consommation cpu et que celui-ci s'arrête donc de monter en fréquence plus tôt que prévu par AMD.
En effet, sous cinebench r20, la "power reporting deviation" remontée par hwinfo est de 108-110%.
par Eric B., le Mardi 12 Janvier 2021 à 17h53  
Tant mieux si nous avons pu t'apporter une réponse satisfaisante.
par Un ragoteur blond en Provence-Alpes-Côte d'Azur, le Mardi 12 Janvier 2021 à 17h42  
merci de vos précisions qui, de fait, répond a mes interrogations avec plus de facilité comme vous l'écrivez si bien
par Eric B., le Mardi 12 Janvier 2021 à 15h02  
par Un ragoteur blond en Provence-Alpes-Côte d'Azur, le Lundi 11 Janvier 2021 à 20h36
G saisi la diff CCX/CCD mais ça change rien a mon raisonnement : dans tous les cas un CCD avec les mêmes unités actives du CCX générera la même chauffe (donc température résultante)...
Non, un CCD avec les mêmes unités actives générera la même chauffe comme tu l'écris, uniquement si les fréquences et tensions d'alimentation sont strictement identiques, et encore, puisque c'est omettre les courants de fuite qui varient d'une puce gravée à une autre. Mais même en ne les prenant pas en compte, d'un côté tu as un 5800X qui culmine lors de nos tests de consommation à 4,6 GHz @ 1,32 V contre 3,85 GHz @ 1,02 V pour le 5950X. La consommation augmente au carré de la tension et proportionnellement à la fréquence, facile donc de comprendre que la puissance à dissiper sur le CCD du 5800X est supérieure à celle d'un CCD du 5950X, pourtant identique en terme d'unités actives. Quant à la température relevée, elle l'est au niveau du coeur (au sein du CCD donc) le plus chaud.
par Un ragoteur blond en Provence-Alpes-Côte d'Azur, le Lundi 11 Janvier 2021 à 20h36  
par Un ragoteur blond en Provence-Alpes-Côte d'Azur, le Lundi 11 Janvier 2021 à 20h20
je confond peu etre ccx et ccd
G saisi la diff CCX/CCD mais ça change rien a mon raisonnement : dans tous les cas un CCD avec les mêmes unités actives du CCX générera la même chauffe (donc température résultante) par contre je considère que le clOD influe de façon identique tous comme infinity d'ailleurs.
Le 5800x possède le même CCD (en 1 seul exemplaire) que le 5950x , en toute logique on retrouverai au contraire plus de chauffe au 5950x vu qu'ils possèdent tous les 2 le même "encapsulage" : exemple par analogie; une pièce avec 1 chauffage de 500W monte moins vite en température que la même piece avec 2 chauffage de 500w
J'essaie de comprendre un telle différence de temps entre 5800x et 5950x.
par Un ragoteur blond en Provence-Alpes-Côte d'Azur, le Lundi 11 Janvier 2021 à 20h20  
par Un ragoteur blond en Provence-Alpes-Côte d'Azur, le Lundi 11 Janvier 2021 à 20h14
oui j'ai bien lu cette partie, mais les températures relevées sont au niveau du die (ccd) qui lui est identique entre les 2 procos ?
je confond peu etre ccx et ccd
par Un ragoteur blond en Provence-Alpes-Côte d'Azur, le Lundi 11 Janvier 2021 à 20h14  
par Thibaut G., le Lundi 11 Janvier 2021 à 19h42
"Ce n'est par contre pas le cas du 5800X, qui doit composer avec une consommation proche de ses grand-frères mais répartie sur 2 puces uniquement (cIOD + 1 CCD), contre 3 (2 CCD) pour ces derniers"
oui j'ai bien lu cette partie, mais les températures relevées sont au niveau du die (ccd) qui lui est identique entre les 2 procos ?