COMPTOIR
  
register

×
×
×
×
×
×
×
×
×

Test • AMD Zen 2 : X570 & Ryzen 7 3700X / Ryzen 9 3900X
zen2 archi cache hier t
zen2 archi cache hier t
zen2 archi cache hier t
Problématique multi-chip avec process de gravure différent
Différence d'épaisseur du substrat suivant process
gamme ryzen 3000
precision boost2
Fréquence R9 3900X
cpuz r7 3700x

• Ryzen 3000

Alors que nous avons pour habitude de vous proposer une photo du die des nouveaux CPU, l'approche en chiplets ou multi-chip d'AMD change quelque peu la donne. SI vous avez séché les pages précédentes, le die monolithique est abandonné pour laisser place à un module I/O gravé en 12 nm (annoncé en 14nm au CES 2019) qu'AMD nomme cIOD, ainsi qu'un ou plusieurs modules Compute gravés de leur côté en 7 nm, CCD de leur petit nom. Le tout est interconnecté par l'Infinity Fabric dans sa version 2.0. Il s'agit du prolongement logique de la stratégie des premiers Ryzen, qui n'utilisaient qu'un seul et unique die pour toute la gamme, en jouant sur le nombre de CCX activés ou en rajoutant des dies pour obtenir des CPU massivement parallèles (EPYC et Threadripper), à la différence près qu'AMD n’intègre carrément qu'un seul die de calcul sur les configurations équipées de 8 cœurs ou moins, économisant ainsi du silicium chèrement gravé en 7 nm.

 

zen2 archi cache hier t [cliquer pour agrandir]

Faute de die shot, voici les connexions internes pour une configuration à deux CCD

 

zen2 archi cache hier t [cliquer pour agrandir]

 

La version à 1 CCD intègre au maximum 32 Mo de L3, et communiquera avec l'extérieur selon un débit de 32 octets/cycle, ce qui correspond exactement à la bande passante maximale des unités de chargement rangement du CPU : logique !

 

zen2 archi cache hier t [cliquer pour agrandir]

 

Pour la mouture à 2 CCD, le paroxysme est atteint avec 64 Mo de L3, les caractéristiques des bandes passantes restant inchangées. Notons qu'avec le contrôleur mémoire partagé au sein du cIOD, aucun cœur ne sera pénalisé pour les accès mémoire en comparaison des autres (syndrome 2990WX), évitant donc l'effet NUMA (Non-Uniform Memory Access), bien connu de Threadripper et des configurations multi-socket.

 

Avec un tel découpage, les coûts de production se réduisent massivement : AMD n'a en effet qu'un seul type de masque par procédé de gravure à créer. Le coup est même double, car en jouant sur les lithographies, les rouges optimisent leur prix. Comprenez que le 7 nm n'est présent que là où il apporte un vrai gain (la partie compute du CPU = CCD). Le reste, c'est-à-dire les interfaces (contrôleur mémoire, PCIe, etc.), est contenu au sein du cIOD, gravé avec un processus meilleur marché (12 nm), sans altérer pour autant les performances de ces fonctionnalités. L'image ci-dessous illustre la mise en œuvre de cette stratégie par AMD.

 

multi chip

L'approche multi-chip d'AMD : un coup de maître ?

 

Si dans le principe tout cela parait simple et logique en cette période de ralentissement de la conjoncture de Moore, cela n'est pas sans poser quelques problèmes. En effet, le "pas" ou pitch des "bosses" de soudure servant à l’interconnexion du die sur le packaging, est supérieur en 12 nm par rapport au 7 nm. Il faut donc parvenir à uniformiser ces pitchs afin de pouvoir réaliser les interconnexions de toutes les puces sur le même packaging. Compte tenu de la densité moindre en 12 nm, cela constituait donc un défi pour la production.

 

Problématique multi-chip avec process de gravure différent [cliquer pour agrandir]

La problématique d'une telle approche

 

Afin d'y parvenir, AMD (ses sous-traitants) est passé sur ses puces I/O 12 nm (cIOD), de "bosses de soudures simples" à des piliers en cuivre plus compacts/fins, normalement réservés au process 7 nm. Le principe est de créer un support sur lequel sera déposée la soudure, cette dernière étant moindre du fait du diamètre limité du pilier en cuivre lui servant de support. Parmi les effets bénéfiques de cette adaptation d’interconnexions, la hauteur des dies après assemblage est identique malgré un processus de gravure différent, ce qui évite d'avoir à corriger la différence de niveau lors de l'encapsulage du CPU (mise en place du heat-spreader avec TIM), opération complexe selon AMD.

 

Différence d'épaisseur du substrat suivant process [cliquer pour agrandir]

Le défi du multi-chip incluant des process différents

 

AMD a présenté lors d'un événement à Los Angeles, sa gamme de CPU qui sera commercialisée dans les jours qui viennent. À noter que les 3200G et 3400G n'utiliseront pas Zen 2, mais Zen+, tout en étant gravés en 12 nm. À partir du 3600 on bascule dans les "véritables" nouveautés avec 2 hexacores, 2 octocores et un dodécacore. À cela il faudra ajouter le Ryzen 9 3950X à 16 cœurs (750 $ quand même), qui ne sera commercialisé qu'à la rentrée. La comparaison avec la gamme d'Intel semble positionner les nouveaux venus très favorablement. On notera tout de même l'étrange comparaison des caches, avec l'addition du L2 & du L3 côté AMD, nommée pour le coup Gamecache (encore une idée géniale de bob du marketing).

 

gamme ryzen 3000 [cliquer pour agrandir]

La gamme Ryzen 3000 et ses concurrents désignés

 

Attardons-nous quelques instants sur Precision Boost 2, déjà étrenné sur la série Ryzen  2000. Il permet de profiter de fréquences plus élevées, suivant le taux d'usage de chaque coeur sollicité. Via Ryzen Master, il est possible d'activer un overdrive qui s'affranchit de la limite de consommation (dans le respect des capacités de dissipation du refroidisseur employé), et nouveauté à présent, il est possible de le coupler avec un overclocking automatique capable d'ajouter jusqu'à 200 MHz au maximum.

 

Précisons à présent la notion de PPT (Package Power Tracking) qui est employée par AMD. Cette dernière correspond à la puissance électrique que le socket doit être en mesure de fournir (hors overclocking), une façon comme une autre de s'affranchir d'un TDP trop contraignant pour la tenue des fréquences en Boost. Ainsi, les CPU disposant d'un TDP officiel à 105 W, voit leur PPT prendre une valeur d'au moins 142 W. Pour un TDP de 65 W, le PPT sera lui >= 88 W. 

 

precision boost2 [cliquer pour agrandir]

Precision Boost 2

 

Encore quelques précisons au niveau de la gestion des fréquences, l'UEFI CPPC2 (Collaborative Performance and Power Control) fait son apparition pour cette génération. Il s'agit en pratique d'une nouvelle méthode de changement d'état du CPU (repos à boost par exemple), qui ne s'appuie plus sur les classiques pStates, mais sur un pilotage direct au niveau du firmware CPU. Quel intérêt ? La réactivité, puisque là où il faut en moyenne une trentaine de millisecondes pour changer de fréquence via pState, il n'en faut qu'une à deux avec CPPC2. Cela permet donc des gains de performances lors d'une brusque sollicitation (lancement d'application, chargement d'une page Web lourde, etc.)

 

cppc2

 

A noter qu'il est nécessaire d'utiliser Windows 10 1903 minimum et des pilotes chipsets AMD supportant CPPC2, pour profiter de ce dernier. Cette version (et les futures) de l'OS vedette de Microsoft, apporte d'autres avantages aux Ryzen. Ainsi, toujours via CPPC2, le CPU peut communiquer à l'ordonnanceur de Windows 10 les cœurs à préférer, évitant ainsi que ce dernier ne "ballade" un processus d'un cœur à un autre en changeant de CCX, ce qui induirait une pénalité de latence due au lien IF entre CCX. Passons à présent aux CPU qu'AMD nous a fourni pour ce test : les Ryzen 7 3700X, et Ryzen 9 3900X. Physiquement, ils reprennent les dimensions habituelles des processeurs AMD, avec un côté de 40 mm. Seule la sérigraphie permet de différencier les puces entre elles. Ci-dessous le 3900X.

 

r9 3900x rector9 3900x verso

Ryzen 9 3900X recto et verso

 

Sont petit frère ne diffère pas visuellement des autres Ryzen au format AM4 non plus : 

 

r7 3700x rector7 3700x verso

 Ryzen 7 3700X rectal et versal

 

Voyons ce que CPU-Z pense de notre processeur, ici le Ryzen 9 3900X. On retrouve les 12 cœurs prenant en charge 24 threads, le bus est toujours cadencé à 100 MHz et l'application d'un coefficient multiplicateur lui permet d'atteindre la fréquence souhaitée. Ce coefficient n'est pas forcément entier puisque la fréquence peut évoluer avec une granularité de 25 MHz. Celle de base du R9 3900X a été fixée à 3,8 GHz par AMD, pour un TDP de 105 W, et comme presque toujours, les coefficients ne sont pas bloqués en montée. Point intéressant, l'intégralité du cache L3 est utilisable (64 Mo) ce qui signifierait que les 4 CCX sont actifs (à raison de 3 coeurs par CCX) ; ce qui semble en outre confirmé par des benchmarks internes, nous mettrons à jour ce dossier au fur et à mesure de nos progrès sur le sujet.

 

Fréquence R9 3900X [cliquer pour agrandir]

CPU-Z Ryzen 9 3900X

 

En charge, la fréquence maximale atteignable est de 4,6 GHz, nous n'avons jamais pu la constater visuellement via CPU-Z ou HWinfo, mais nous n'en sommes pas loin avec ce dernier. À noter que dans ces conditions, la tension lue par CPU-Z est de 1,46 V. Du fait de l'architecture multi-chip, il est difficile de savoir exactement à quoi correspond exactement cette dernière et nous sommes toujours en attente des réponses d'AMD à ce sujet. Lorsque tous les cœurs sont sollicités, la fréquence chute jusqu'à 4125 MHz avec 1,33 V, toujours selon CPU-Z.

 

hwinfo 3900x

Ryzen 9 3900X : fréquences en charge avec 1 cœur puis tous cœurs actifs

 

Voyons ce qu'il en est du Ryzen 7 3700X à présent. On retrouve les 8 cœurs prenant en charge 16 threads, la fréquence de base du CPU ayant été fixée à 3,6 GHz par AMD afin de se conformer au TDP de 65 W. Comme il n'y a plus qu'un seul CCD présent, le cache L3 se limite à 32 Mo, soit le double des générations précédentes tout de même. 

 

cpuz r7 3700x [cliquer pour agrandir]

CPU-Z Ryzen 7 3700X

 

En charge sur un cœur, nous n'avons pas plus réussi à visualiser la fréquence max. annoncée, soit 4,4 GHz, nous limitant à 25 MHz de moins, toujours avec une tension lue extrêmement élevée (1,48 V). Les 8 cœurs actifs conduisent à une fréquence chutant jusqu'à 4175 MHz et 1,37 V.

 

hwinfo 3700x

Ryzen 7 3700X : fréquences en charge avec 1 cœur puis tous cœurs actifs

 

 

Voilà pour les Ryzen 3000 en notre possession, passons à présent à la plateforme destinée à les accompagner.



Les 253 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !