COMPTOIR
register

×

FinFET

Test • RADEON RX 480
FinFET
FinFET
diagramme logique de polaris 10
les 4 principes retenus par AMD pour l'architecture polaris
4e génération GCN
Diagramme logique P10
plus de perfs en géométrie par la réduction des données transférées dans le moteur de rendu
plus d'efficacité dans le pipeline de Polaris...
...vraiment plus efficace qu'ils disent !
un moteur de compression amélioré, comme chez les verts.
un cache L2 doublé, enfin !
async
adaptativeclocking
adaptativeclocking
avfs
btc
agingcomp
mbff
HDR
Decodage

• Polaris 10 & GCN 4

Le voici enfin ce nouveau GPU dont AMD parle depuis janvier ! Si le département marketing lui a trouvé un non qui claque avec Polaris 10 (puisqu'une version 11 plus petite sera également lancée sous peu), il dispose toutefois d'un nom de code correspondant comme à l'accoutumée à une île, en l'occurrence Ellesmere située dans l'océan arctique (logique puisqu'il fait parti de la série Arctic Island). A l'image de la génération Pascal du concurrent, ces GPU étaient très attendus par les amateurs pour deux raisons : d'une part l'évolution de l'architecture avec GCN dans sa 4ème itération, mais aussi (enfin) le passage à un nouveau procédé de gravure !

 

FinFET [cliquer pour agrandir]FinFET [cliquer pour agrandir]

 

En effet, exit le 28 nm de TSMC et place à un 14 nm réalisé par Global Foundries sous licence technologique Samsung. Par rapport au 16 nm de TSMC utilisé par le concurrent, AMD indique un avantage de 8% en terme de densité de transistors même si ce point n'est qu'une composante définissant la qualité du process ( quid de la montée en fréquence et consommation par exemple ?). Point commun aux deux procédés concurrents, le FinFET, c'est à dire l'utilisation de transistors "3D" permettant de réduire les courants de fuite et augmenter significativement les fréquences. Par contre, à contrario des verts qui avait inauguré leur nouveau process avec une puce très complexe (GP100 mesurant plus de 600 mm²), les rouges sont beaucoup plus mesurés avec une puce de "seulement" 232 mm² pour 5.7 Milliards de transistors. C'est donc notablement plus petit que le GP104 des GTX 1070/1080 (7.2 Mds de transistors pour 314 mm²), AMD ne cherche donc pas à se battre avec ces cartes d'un strict point de vue des performances. Poursuivons avec une vue du die de Polaris 10 :

 

diagramme logique de polaris 10 [cliquer pour agrandir]

Die de Polaris 10

 

Une bien belle image mais à quoi avons nous droit en pratique avec ces 5.7 Mds de transistors ? AMD s'appuie toujours sur GCN (Graphics Core Next) et en profite d'ailleurs pour nommer les différentes révisions, chose qu'il s'était toujours refuser à faire précédemment. Nous en sommes donc à la version 4 et le concepteur en profite pour indiquer les 4 principes (ça tombe bien, hein !) retenus pour développer les puces Polaris. 

 

les 4 principes retenus par AMD pour l'architecture polaris [cliquer pour agrandir]4e génération GCN [cliquer pour agrandir]

Evolution GCN et les 4 principe de Polaris

 

Passons à présent au diagramme logique du GPU. Pas de refonte profonde de l'architecture, AMD s'appuie toujours sur des structures internes nommées Shader Engine. Ces dernières comprennent les unités géométriques (génération des triangles, tesselation) et de rastérisation (transformation des triangles en pixels), les ROP (unités écrivant en mémoire) et les CU (Compute Unit) qui sont dédiées au calcul et au texturing. 

 

Diagramme logique P10 [cliquer pour agrandir]

Diagramme logique de Polaris 10

 

A l'instar des dernières création d'AMD (Tonga et Fiji), on reste à 4 Shader Engine ce qui implique un maximum de 4 triangles par cycle. Notons tout de même que les unités géométriques progressent légèrement afin d'éviter de saturer les buffers lors d'un usage extrême de la tesselation, via le Primitive Discard Accelerator chargé d'éjecter très rapidement les primitives dans ce cas particulier. Du côté des CU, leur efficacité est en hausse par le biais de buffers élargis et d'un prefetch optimisé, enfin l'accès au cache L2 et donc à la mémoire a été amélioré. 

 

plus de perfs en géométrie par la réduction des données transférées dans le moteur de rendu [cliquer pour agrandir]plus d'efficacité dans le pipeline de Polaris... [cliquer pour agrandir]

 

Tout ceci permettrait selon AMD une augmentation de 15% de l'efficacité des CU par rapport aux versions précédentes. Du côté de l'interface mémoire, vu la taille de la puce, les rouges se contente de 32 ROP associés à une largeur de bus 256-bit, mais la compression Delta Color (codage différentiel des couleurs) progresse également pour augmenter la bande passante effective. 

 

...vraiment plus efficace qu'ils disent ! [cliquer pour agrandir]un moteur de compression amélioré, comme chez les verts. [cliquer pour agrandir]

 

A l'instar de ce qu'avait fait le concurrent avec Maxwell, le cache L2 est porté à 2 Mo afin d'améliorer le rendement des contrôleurs mémoires et réduire la consommation. L'effet cumulé de ces 2 points permettrait un gain de 40% à ce niveau par rapport à Hawaii (qui ne dispose pas de compression delta color). Du côté des Async Compute, AMD propose en sus des modes concomitants et préemption (arrêt d'une tâche pour traiter en priorité une autre) un mode Quick Response Queue qui permet cette fois d'attribuer arbitrairement plus des ressources à une tâche compute traitée en concomitance avec d'autres afin d'accélérer son traitement.

 

un cache L2 doublé, enfin ! [cliquer pour agrandir]async [cliquer pour agrandir]

 

AMD n'a pas oublié le gros point faible de son architecture face au concurrent à savoir l'efficacité énergétique. En sus de l'action au niveau de l'interface mémoire, Il ne s'est donc pas contenté des gains apportés par le process mais a mis en place toute une série de technologies destinées à améliorer ce point. Commençons par l'adaptative clocking qui induit une baisse de fréquence (inférieure à 1 ns) du GPU pour permettre de compenser les chutes de tensions survenant au niveau de l'alimentation GPU. De quoi réduire la marge de sécurité de cette dernière et  donc la tension de 5 à 10% .

 

adaptativeclocking [cliquer pour agrandir]adaptativeclocking [cliquer pour agrandir]

 

Poursuivons avec l'AVFS pour adaptative voltage & frequency scaling. Kesako ? AMD a en fait ajouté des capteurs de fréquence et tension à divers emplacements de la puce lui permettant de définir la tension idéale en fonction de sa "qualité". Il s'agit donc d'une individualisation des puces, certaines pourront donc être meilleures que d'autres et profiter de ce fait de gain de consommation au lieu de se voir attribuer par défaut la tension correspondant au cas le plus défavorable. Vient ensuite le BTC qui reprend le principe de l'auto-détermination mais appliqué à l'étage d'alimentation permettant ainsi d'éviter là-aussi des marges de sécurité induisant des surconsommations, l’information étant remontée à l'AVFS.

 

avfs [cliquer pour agrandir]btc [cliquer pour agrandir]

 

Finissons ce point d'optimisation énergétique avec les 2 derniers éléments sur lesquels communique AMD : l'adaptative aging compensation permet de supprimer la marge de sécurité normalement appliquée pour compenser le vieillissement des transistors. Cette dernière disparaît puisque le GPU s'autocalibre et enverra à l'AVFS une information demandant une augmentation de tension si le besoin s'en fait sentir au cours de la vie du GPU. Cela permet des gains dans l’immédiat mais la puce peut s'avérer moins économe en vieillissant. Enfin, le MBFF (Multi-bit-flip-flop) permet de gagner 4 à 5% au niveau de la consommation du GPU en optimisant les changements d'états qui correspondent, mine de rien, à 15% de la consommation totale de la puce.

 

agingcomp [cliquer pour agrandir]mbff [cliquer pour agrandir]

 

Terminons le tour des évolutions apportées par Polaris 10 avec un moteur vidéo enfin au goût du jour puisque AMD rattrape son retard sur NVIDIA en proposant le HDMI 2.0b incluant l'HDCP 2.2 nécessaire pour visualiser certains Blu-ray UHD. Pour le Display Port, il est prêt pour les normes 1.3 et 1.4, c'est à dire le 5K en 60 Hz pour le premier et l'HDR 10-bit en 4K jusqu'à 96 Hz pour le second. Côté encodage/décodage, la prise en charge du HEVC jusqu'en 4K 60 Hz ainsi qu'un nouvel algorithme destiné à améliorer la qualité des vidéos encodées via 2 passes. 

 

HDR [cliquer pour agrandir]Decodage [cliquer pour agrandir]

 

 Voilà, c'est tout pour Polaris, passons aux spécifications des cartes employant ce nouveau GPU.

 



Un poil avant ?

Les waterblocks EK pour GP104 arrivent dans le commerce

Un peu plus tard ...

Microsoft ajouterait un bouton pour refuser l'offre de mise à jour vers Windows 10

Les 253 ragots
Les ragots sont actuellement
ragots réservés aux QI élevésouverts aux ragoteurs logués
par Eric B., le Mercredi 10 Août 2016 à 09h51  
Nous n'avons malheureusement jamais réussi à mettre la main sur une Nano, mais d'après les tests de nos confrères qui ont été samplés elle se situerait légèrement en dessous d'une Fury (non X et non OC). Et pour le deuxième point, qu'entends-tu par la founder ? La 1070 Founders Edition ? La Fury X ? Dans les 2 cas c'est oui tout à fait normal, les 4% d'overclocking du GPU de la Sapphire Fury Tri-X OC testée ne suffisent pas à compenser l'écart la séparant de ces modèles de références notablement plus performants par défaut.
par Gry20r, le Mardi 09 Août 2016 à 19h11  
J'aurai une question, ou se placerait la R9 Nano dans vos benchs ?
Je sais qu'elle ne cours pas les rues, mais elle me fait de l'oeil en ce moment

Et truc bizarre, la R9 fury de sapphirre pourtant overclock, est constamment derriere la founder, c'est normal ?
par Thibaut G., le Lundi 11 Juillet 2016 à 12h21  
par Kavo le Lundi 11 Juillet 2016 à 12h06
Site pro Nvidia comme toujours :')
oui on est des vendus pro nv...
par seb4771, le Lundi 11 Juillet 2016 à 12h14  
par Kavo le Lundi 11 Juillet 2016 à 12h06
Site pro Nvidia comme toujours :')
TOUT a fait, la BX était verte avant, c'est un camouflage

Sinon j'ai retourné les rx480 "vanilla" aux VPC, je me vois mal mettre des GPU pas stabilisé dans le temps.
Ca marche bien par 2, pas eu de souci perso AVEC les pilotes.
25 fps de + dans les jeux VS mes 2x r9 280x dcuII 1100/1600 en 1920x1200.
et juste 37 fps de - que mes 2x 980 Ti@+20%, parfaitement dans les clous niveau perfs/prix.

Plus qu'a attendre des customs qui TARDENT grave.
par Kavo, le Lundi 11 Juillet 2016 à 12h06  
Site pro Nvidia comme toujours :')
par Thyrion, le Samedi 09 Juillet 2016 à 15h58  
par seb4771 le Dimanche 03 Juillet 2016 à 07h59
La petite news qui est pas super :

Les RX480 crament le bus pci-e si on fait du minage avec OU elles lâchent à force
Bref à voir avec les customs car là on a l'impression que AMD à merdé grave sur l'alim des cartes.
Quid de l'intérêt de faire du minage avec des cartes graphiques de nos jours ?

Nan là ou AMD a vraiment merdé c'est qu'à force de cuire des côtelettes avec des 480, elles finissent par lâcher ! Proprement scandaleux !
par seb4771, le Dimanche 03 Juillet 2016 à 07h59  
La petite news qui est pas super :

Les RX480 crament le bus pci-e si on fait du minage avec OU elles lâchent à force
Bref à voir avec les customs car là on a l'impression que AMD à merdé grave sur l'alim des cartes.
par korytion, le Samedi 02 Juillet 2016 à 15h31  
par Sciroccu le Samedi 02 Juillet 2016 à 13h44
Notre bon président Mr Hollande est contre la finance et n'aime pas les riches...c'est pour cela qu'il crée des pauvres !
Il peut également fermer les écoles car c'est une fabrique à chômeur. Tout ça pour dire que j'attends le haut de gamme car y'a pas asser de différence avec ma carte actuelle. Et comme la plupart d'entre nous. Je fais pas dans la surenchère
par Sciroccu, le Samedi 02 Juillet 2016 à 13h44  
Notre bon président Mr Hollande est contre la finance et n'aime pas les riches...c'est pour cela qu'il crée des pauvres !
par korytion, le Samedi 02 Juillet 2016 à 12h04  
par Sciroccu le Samedi 02 Juillet 2016 à 11h33
"J'en attendais énormément de cette carte pour remplacer ma 7970 GHz car je joue en eyefinity. Bah je suis pas encore prêt de la changer. Très déçu"

T u voulais remplacer un haut de gamme par un moyen de gamme en espérant des miracles et tu es déçu, franchement tu me décois !
Avant j'étais riche, mais ça c'était avant
par Sciroccu, le Samedi 02 Juillet 2016 à 11h33  
"J'en attendais énormément de cette carte pour remplacer ma 7970 GHz car je joue en eyefinity. Bah je suis pas encore prêt de la changer. Très déçu"

T u voulais remplacer un haut de gamme par un moyen de gamme en espérant des miracles et tu es déçu, franchement tu me décois !
par seb4771, le Samedi 02 Juillet 2016 à 07h20  
par korytion le Samedi 02 Juillet 2016 à 04h17
J'en attendais énormément de cette carte pour remplacer ma 7970 GHz car je joue en eyefinity. Bah je suis pas encore prêt de la changer. Très déçu
Pour ça t'as la fury X depuis un moment si tu voulais vraiment des perfs en AMD.

Là c'est tout de même +15 fps de différence pour 250 280 euros, pas négligeable et t'as + de ram ce qui aide pas mal.