COMPTOIR
register

×

Activation du mode NUMA

Test • AMD Ryzen Threadripper 2950X / 2990WX
Activation du mode NUMA
Ryzen Master : Game mode

• UMA, NUMA et Game Mode

Comme nous l'écrivions précédemment, les Threadripper de seconde génération peuvent utiliser soit 4 die actifs (série WX) soit 2 (série X). Dans tous les cas, seuls les contrôleurs mémoire de 2 die seront utilisés pour conserver la compatibilité avec le câblage des cartes mères TR4. De fait, la série X est la seule à pouvoir profiter au choix des protocole UMA ou NUMA puisque chaque die actif dispose de son propre contrôleur mémoire. Comme souvent, l'efficience de chaque protocole variera grandement selon les applications, c'est pourquoi AMD active par défaut celui le plus performant en moyenne, à savoir UMA. Il est toutefois possible via Ryzen Master (redémarrage imposé) de changer ce fait, en passant l'option Memory Access Mode de Distributed (UMA) à Local (NUMA).

 

Activation du mode NUMA [cliquer pour agrandir]Le réglage du protocole mémoire sous Ryzen Master

 

Ryzen Master propose également le mode Game qui est censé améliorer les performances et la compatibilité des Threadripper pour les tâches ludiques. Dans le cas de la série X, la gestion mémoire passe en NUMA et seuls 8 cœurs restent actifs.  Pour la série WX, ce dernier choix n'est pas applicable du fait de la désactivation en usine des contrôleurs mémoires de 2 die. De son côté, le mode Game permet bien, lui, de réduire le nombre de die actifs. La différence étant que cette fois on peut choisir d'en désactiver la moitié (16 cœurs) ou les 3/4 pour ne conserver que 8 cœurs actifs, là-aussi via Ryzen Master.

 

Ryzen Master : Game mode [cliquer pour agrandir]Le Game mode du TR 2990WX sous Ryzen Master

 

Nous avons décidé de tester les impacts pratiques de ces modes respectifs en commençant par les tests du sous-système mémoire à l'aide d'AIDA64. On constate que le mode NUMA permet des gains substantiels en lecture mémoire (+21%) et latence (-25%) sur le TR 2950X. A noter que par défaut, la latence mesurée par AIDA64 pour le TR 2990WX, est du même ordre puisque ce dernier fonctionne exclusivement en accès NUMA.

 

Les Game mode 1/4 du Flagship et celui du 2950X, montrent un fonctionnement à 2 canaux mémoire, ce qui est logique puisqu'il ne reste dans les 2 cas plus qu'un seul die actif. Enfin, le Game Mode 1/2 du TR 2990WX conduit à des performances mémoire similaires à celles du TR 2950X en NUMA, ce qui est là-aussi logique, puisque l'on se retrouve avec la même configuration de part et d'autre.

 

 

Les tests mémoires sont bien beaux, mais quid d'applications plus pratiques ? Selon les logiciels, on peut passer de très grosses pertes (Lightroom, VeraCrypt) à des gains d'une dizaine de pourcents (After Effects)  pour le mode NUMA du TR 2950X. Au final, sur notre nouveau panel de tests, nous mesurons une perte moyenne d'un peu plus de 7%, alors que l'an dernier nous mesurions une baisse de 5% dans ce mode pour le TR 1950X. La version de l'OS et de nombreux logiciels ayant changés depuis, la désactivation par défaut de ce mode par AMD, parait donc toujours aussi pertinent.

 

 

Et les jeux dans tout ça ? Commençons par le TR 2990WX : par défaut il ne propose que 63,8 % du niveau de performance du R7 2700X en jeu, avec une énorme contre-performance sous Warhammer 2. En activant le Game mode 1/2, on retrouve 94% du niveau atteint par le 2700X, avec un Warhammer 2 toujours en retrait mais de manière (bien) moins dramatique. Enfin, le mode 1/4 permet d'atteindre 98% du plus rapide des Ryzen 7, autant dire que les différences seront invisibles. Du côté TR 2950X, le mode NUMA permet de progresser de 3% (à 92% du niveau du 2700X contre 88% par défaut). Le Game mode le ramène au même niveau que son grand-frère dans les mêmes conditions, soit 98% de ce qu'est capable de débiter un R7 2700X en jeu.  

 

 

Voilà, c'est terminé pour cette partie, passons au protocole de tests page suivante



Un poil avant ?

L'IA et le hardware : et si tout était à recommencer ?

Un peu plus tard ...

Hard du hard • Condensateur d’alimentation, une histoire de taille

Les 58 ragots
Les ragots sont actuellement
pour éviter les trolls des fanboys ...ouverts aux ragoteurs logués
par Anth0x, le Mercredi 03 Octobre 2018 à 10h31  
Tout ça pour dire que au final Intel reste toujours plus cher et meilleur en gaming

Après l'hiver arrive les gens prendront peut être des AMD pour la raclette
par Cristallix, le Jeudi 23 Août 2018 à 22h27  
Bravo pour ton énorme dossier qui a nécessité un gros boulot !!

J'suis impressionné par la consommation OC du 2990WX
Par contre non oc par rapport à Intel le rendement est bon. Bravo à AMD
par le breton old school, le Dimanche 19 Août 2018 à 10h15  
par Jemporte le Vendredi 17 Août 2018 à 21h40
Intel, avec 18 coeurs plus lents en fréquence, fait souvent mieux qu'AMD avec 32 coeurs relevant d'un assemblage relevant du système D, à 250W de TDP. Pas vraiment efficace l'Infinty Fabric.
Maintenant, pour certaines tâches et à un prix finalement un peu moindre seulement, ça fait l'affaire face à la solution plus élégante d'Intel.
Comme l'a dit Eric, tout dépend de l'usage qu'on veut en faire, et il répond bien mieux que le concurrent sur certains usages.
Et puis si t'es pro 'un tel' , tant mieux aussi puisqu'AMD le pousse à sortir du bois.
par Jemporte, le Vendredi 17 Août 2018 à 21h40  
Intel, avec 18 coeurs plus lents en fréquence, fait souvent mieux qu'AMD avec 32 coeurs relevant d'un assemblage relevant du système D, à 250W de TDP. Pas vraiment efficace l'Infinty Fabric.
Maintenant, pour certaines tâches et à un prix finalement un peu moindre seulement, ça fait l'affaire face à la solution plus élégante d'Intel.
par skazar, le Mardi 14 Août 2018 à 18h02  
En fait c etait juste pour le fun
par fansyl, le Mardi 14 Août 2018 à 12h06  
Clairement, la nouvelle génération Epyc s'affranchira de ces problèmes de contrôleur mémoire grâce aux 8 canaux disponibles, vivement !
par Eric B., le Mardi 14 Août 2018 à 10h15  
Oui je n'en doute pas, mais nos tests sont calibrés pour justement éviter au maximum les limitations liées à la quantité de mémoire (on ne peut pas atteindre de telles capacités sur toutes les plateformes à tester), d'où ma remarque. Tester notre protocole avec tes 64 Go n'y changerait pas grand-chose à la variation près du type de barrette.
par fabtech, le Mardi 14 Août 2018 à 10h00  
par Eric B. le Mardi 14 Août 2018 à 09h49
Non désolé. Après les tests sont un minimum détaillés, rien n'empêche de faire quelque chose d'approchant. Après, je ne suis pas sûr que 64 Go changerait grand-chose à nos résultats, si ce n'est les gains liés aux barrettes dual ranked si tu utilises 4 x 16 Go.
Avec 64Go j'ai presque doublé la vitesse de rendu d'un projet sous After Effects par rapport à 32Go avec mon 6950x.
Les tests sont un peu biaisé ici car pour bien exploiter son CPU avec After Effects, il faut calculer au minimum 1 à 2Go de ram par Thread pour commencer à tirer le maximum de son CPU.
par Eric B., le Mardi 14 Août 2018 à 09h49  
Non désolé. Après les tests sont un minimum détaillés, rien n'empêche de faire quelque chose d'approchant. Après, je ne suis pas sûr que 64 Go changerait grand-chose à nos résultats, si ce n'est les gains liés aux barrettes dual ranked si tu utilises 4 x 16 Go.
par skazar, le Mardi 14 Août 2018 à 09h05  
votre protocole de test est disponible?
je le ferais bien essayer à ma machine
1950x+64go
par Eric B., le Lundi 13 Août 2018 à 21h45  
J'ai édité légèrement depuis ta citation, mais tu as raison cette pénalité risque de perdurer si la plateforme n'évolue pas et qu'AMD conserve cette approche de multiplier les dies au sein d'un même packaging. Pour la seconde question, je ne suis pas architecte CPU, mais cela me parait difficile de résoudre simplement la problématique posée par cette configuration asymétrique. Après, on peut tout imaginer dans le futur, comme des die avec plus de coeurs, mais toujours deux canaux mémoire et revenir ainsi à une configuration moins "bancale" façon série X (2 die), tout en dépassant 16 coeurs et conservant la compatibilité. (c'est purement hypothétique afin d'illustrer mon propos et ne repose sur rien de concret).
par Krenian, le Lundi 13 Août 2018 à 21h33  
par Eric B. le Lundi 13 Août 2018 à 21h18
Oui en partie, ce côté bi-polaire de la configuration de la puce peut générer des pénalités importantes pour certaines tâches du fait d'un accès non uniforme à la mémoire. L'idéal eut été d'activer au moins un canal par die et 16 lignes PCIe si AMD souhaitait a tout prix garder un avantage aux Epyc, malheureusement ça voulait dire que le câblage des cartes mères TR4 existantes devenait incompatible, nécessitant de les remplacer (il en aurait été de même si les 8 canaux mémoires et 128 lignes PCIe étaient activés). C'est plutôt dur à faire passer comme pilule. Je pense qu'à l'origine AMD ne souhaitait pas forcément aller au-delà de 2 die / 16 coeurs, c'est pourquoi la situation actuelle n'a pas été anticipée, mais que ne ferait-on pas pour coller un caillou dans la chaussure du concurrent.
Mais si AMD compte garder pendant longtemps cette rétrocompatibilité sur le THDG, ça veut dire que les générations futures seront toujours handicapées par cette pénalité ?
Ou est-il possible de retravailler l'ensemble mémoire pour obtenir un résultat satisfaisant (Zen 2 par exemple) ?