Attention à vos barrettes de RAM, les performances en jeu impactées ? |
————— 30 Juin 2021 à 16h38 —— 25636 vues
Attention à vos barrettes de RAM, les performances en jeu impactées ? |
————— 30 Juin 2021 à 16h38 —— 25636 vues
Si vous faîtes partie des djeuns (ou moins djeuns) à surfer sur le jeune média que représente YouTube, et à l’utiliser comme source d’information en ce qui concerne les actualités informatiques, alors vous n’avez pas dû passer à côté de la nouvelle tempête. Si tel n’est pas le cas, laissez-nous rerésumermuer : une première vidéo - intégrée ci-dessous — de Jarrod’s Tech montre des gains impressionnant en matière de performances d’un laptop équipé d’une RX 6800M de chez AMD et d’un Ryzen 5900HX.
En particulier, deux décisions totalement indépendantes l’une de l’autre sont critiquées : d’une part, l’impossibilité de désactiver totalement l’iGPU, ce qui signifie qu’une partie de la chaîne d’affichage passe encore par la partie graphique du 5900HX et, d’autre part, l’intégration de modules de RAM utilisant des puces organisées en 1Rx16 (dénommées « by sixteen » en vidéo), comparées aux plus courantes 1Rx8 (« by eight ») du marché. Vous vous en serez douté à la lecture de notre titre, c’est bien de cela que nous discuterons dans les paragraphes suivants ! Notez que la modification de l’un ou l’autre de ces deux paramètres, respectivement en passant par un écran externe et en chargeant la RAM s’accompagne de hausse du nombre d’images par seconde allant jusqu’à 30 % sans impact notable sur la consommation.
Cependant, ASUS s’est tout de même fendu d’un mail explicatif justifiant ces choix par le coût des pièces, qu’il s’agisse des MUX nécessaire pour désactiver l’iGPU comme des puces mémoires, dont la production bouge vers des modules organisés en 1Rx16, plus denses — encore une fois, nous y reviendrons très bientôt plus en détail.
My video covering the gaming performance of this laptop will be out in about 12 hours, ASUS have shared the following statement regarding memory/MUX switch with the Strix G15 Advantage Edition: https://t.co/gQl3PmwZfU pic.twitter.com/AK30yVZ6pQ
— Jarrod'sTech (@JarrodsTech) June 11, 2021
En effet, YouTube n’échappant pas aux effets de mode médiatique, la prestigieuse chaîne canadienne Linus TechTips s’est également attelée à des expériences en modifiant les modules RAM, et sont grosso modo arrivés aux mêmes conclusions : changer les modules de RAM de 1Rx16 en 1Rx8 permet d’augmenter les performances en jeu, et même d’égaler la concurrente RTX 3080 en rastérisation pure ; une conclusion d’autant plus importante qu’elle remet en cause la conclusion du test précédent de la carte rouge, et, ainsi, sa pertinence pour l’acheteur final.
Le forum de LinusTechTips est également riche de débats et d’éclaircissements quant aux approximations effectuées lors de la vulgarisation
Pour autant, le phénomène — et c’est souvent le cas en informatique — n’est ni vraiment nouveau, ni aussi simple que cela. Rentrant dans le cas des architectures NUMA — Non-Uniform Memory Access — dont nous vous causions (entre autres) en 2018, les données en RAM sont, en interne, réparties sur plusieurs puces. Lorsqu’une donnée est demandée, un signal est envoyé à l’ensemble des puces, et seule celle contenant la donnée répond qu’il s’agisse d’une requête en écriture comme en lecture. De plus, la notation 1Rx8 et 1Rx16 indique (en autre, nous simplifions ici) la densité des puces utilisées : dans notre cas, les premières seront des puces de 2 Gio, contre 4 Gio dans le second... un fait facilement visible puisque le PCB des barrettes de 8 Gio SO-DIMM — donc d’ordinateur portable — en 1Rx16 n’utilisera qu’un seul des deux côtés pour caser les 4 puces, contre les deux côtés et 8 puces en tout pour le 1Rx8. Cependant, la topologie de la mémoire n’est pas plate : au sein même des puces, l’espace de stockage RAM est hiérarchisé au sein de groupes de banks, et la latence liée à deux accès consécutifs au même groupe de banks est supérieure à deux accès à des groupes différents. En durcissant le trait à l’extrême, le comportement peut être comparé à des SSD, qui sont d’autant plus rapides que le nombre de puces est grand... à l’exception que l’échelle ici est le nombre de groupe de banks par barrette et non la capacité de la barrette.
Pour plus d’information, Actually Hardcore Overclocking vous embarque dans une passionnante séance de lecture de spécificaitons (ici pour les x8, là pour les x16)
Vous l’avez probablement vu arriver, mais les puces utilisées dans une disposition 1Rx16 possèdent moins de banks que celle des 1Rx8, ce qui entraîne théoriquement des performances moindres, tout du moins dans certains cas critiques. Et c’est bien là que les choses se compliquent, car les puces 1Rx16 sont principalement produites pour des applications dans laquelle la densité de la mémoire a une importance — comprenez l’embarqué, où diviser par deux le nombre de puces représente un gain phénoménal, même au prix de performances légèrement castrées. Comprenez donc que leurs latences sont, hors histoire de banks, peu appétissante pour les joueurs. À l’inverse, il est possible de trouver des barrettes en 1xR8 de toutes qualités, y compris plus lentes que celle en 1Rx16 ; d’autant plus que ce cas pathologique des banks est théoriquement très rare, et ne se décèlera pas ou tout du moins pas facilement dans des benchmarks sythétique (par exemple, pas ou très peu lors d’une lecture séquentielle simple de la RAM). Comprenez donc que, plus que le 1RxTruc, les latences nominales sont l'indicateur à piviléger !
Rajoutez à cela que ces ralentissements sont exacerbés sur l’architecture Zen, en particulier sur les ordinateurs portables. À cela, plusieurs explications sont possibles : d’une part, Zen 3 mobile ne bénéficie pas de l’augmentation démesurée du L3, d’où un rôle plus important de la mémoire. D’autre part, de par l’organisation en CCX des cœurs induit très certainement un partitionnement de la mémoire entre ces CCX, et donc une influence démultipliée des latences intra-banks, notamment si un CCX venait à taper systématiquement sur le même bank — notre problème ici. Enfin, l’apparition du Smart Memory Access permet à la carte graphique d’accéder à un espace d’adressage plus large, pour un effet houleux sur PC portable : une fois encore, il n’est pas impossible de retrouver du grabuge à ce niveau, qu’il s'agisse de latence RAM ou de cohérence de cache au sein du processeur.
Enfin, une ultime question se pose : qu’en est-il pour les PC de bureau ? Du fait de barrettes physiquement plus grandes, le risque est bien moindre de tomber sur une version 1Rx16 ; mais — à l’instar des modules SO-DIMM mobiles – la qualité des puces utilisées sera un bien meilleur indicateur de la performance générale. En effet, la qualité et la cadence des puces sont parfois mis en avant par les fabricants dans les modèles haut-de-gamme, citons en exemple les B-die de Samsung, qui apparaissent régulièrement dans les records d’overclocking. Reste que ces informations sont très souvent ardues à retrouver — quand la chose est possible —, d’autant plus sur un laptop ; et c’est bel et bien le consommateur final qui risque de se retrouver floué. (Un grand merci à JeuxGratuit pour son alerte)
Un poil avant ?Un pilote AMD pour Doom Eternal | Un peu plus tard ...Marvell sort l'artillerie ARM Neoverse N2 dans ses OCTEON 10 |