COMPTOIR
  
register

×

Test • RADEON R9 Fury X
diagramme fidji t

• Fiji & HBM

Pour concevoir Fiji, AMD s'est appuyé sur son architecture Graphics Core Next dans sa dernière itération (que l'on retrouve sur Tonga des R9 285/380). Pour plus de détails concernant GCN, vous pouvez vous référer à ce dossier. Elle s'organise à nouveau autour de 4 Shader Engine, comprenant les unités traitant géométrie et rasterization (découpe des triangles en pixels), 16 ROP (écriture en mémoire) et des Compute Units (CU). Ces derniers sont constitués de 64 unités de calcul élémentaires (SP), 4 TMU pour le texturing, différents caches et les transistors de contrôle/ordonnancement de tout ceci.

 

Changement toutefois notable des CU depuis la précédente puce haut de gamme, le débit en double précision a été fortement réduit (1/16 du débit en simple précision contre 1/2) afin d'économiser de précieux transistors dont AMD avait fortement besoin ailleurs. En bref, le même arbitrage que le caméléon a opéré sur son GM200. Par rapport à Tonga, le nombre de CU par Shader Engine est multiplié par 2, passant ainsi à 16 (11 pour Hawaii) pour un total de 64 sur Fiji. Mathématiquement, les unités de calcul et TMU passent respectivement à 4096 / 256. Voyons cela visuellement au travers du schéma suivant :

 

diagramme fidji t [cliquer pour agrandir]

Diagramme logique de Fiji - Cliquer pour agrandir

 

Le choix de conserver 4 Shader Engine implique un débit géométrique stable (4 triangles par cycle), là encore cet arbitrage a été guidé par le nombre maximum de transistors à disposition d'AMD du fait d'un procédé de fabrication stagnant. Cela engendre du coup un équilibre différent entre puissance géométrique et calcul, cette assertion s'appliquant également au fillrate puisque les ROP se cantonnent au niveau d'Hawaii (64), limitant ainsi la progression à la seule évolution de fréquence GPU... Passons au sous-système mémoire, le cache L2 suit le mouvement des SP puisque doublé à 2 Mo tout rond. Enfin, exit les contrôleurs mémoire 64-bit puisqu'avec l'avènement de la HBM, il est nécessaire d'obtenir un bus beaucoup plus large. AMD a donc opté pour 8 contrôleurs 512-bit bidirectionnels, ce qui porte la largeur totale du bus à 4096-bit, excusez du peu. A l'instar de Tonga, ce nouveau GPU dispose des mécanismes de compression couleur (delta color) permettant de limiter le besoin en bande passante mémoire du GPU.   

 

Cela nous amène directement à la grosse nouveauté introduite avec Fiji, la mémoire HBM pour High Bandwitdth Memory. Késako ? En fait il s'agit de la nouvelle génération de mémoire qui délaisse la fréquence au profit de la largeur de bus. Les puces GDDR5, qui pour les plus rapides peuvent atteindre 7 voire 8 Gbps, se contentent d'une interface 32-bit. A contrario, les premières puces HBM se limitent à 1 Gbps (500 MHz DDR) mais utilisent un bus 1024-bit ! Pour ce faire, il a été nécessaire de développer un Silicon Interposer qui est fabriqué par photolithographie comme les CPU ou GPU, à la différence près qu'aucun élément actif (transistor) n'est gravé, juste des interconnections. Cela permet ainsi d'obtenir une densité pour ces dernières bien supérieure à ce qu'il est possible de faire via les techniques existantes de gravure des pistes sur un PCB et ainsi ouvrir la voie à de telles largeurs de bus.

hbm

L'implantation de la HBM pour Fiji

 

L'interposer est également capable de laisser passer par le biais de voies spécifiques en cuivre nommées TSV (Through-Silicon Vias), les connexions du GPU avec le bus PCIe, les sorties vidéos et l'alimentation électrique. Hynix qui est avec AMD le co-concepteur de cette HBM, a conçu pour cette première génération des dies de 256 Mo, chacun étant empilés (die stacking) puis interconnectés et alimentés via TSV également. Ainsi, comme illustré sur le schéma précédent, 4 dies sont "stackés" sur un cinquième comprenant toute la gestion logique de l'empilement avec un adressage 1024-bit (8 canaux 128-bit) pour une capacité totale de 1 Go. Fiji étant entouré de 4 de ces puces (dites 2.5D) sur l'interposer, on retrouve ici le bus mémoire 4096-bit du GPU. Chaque contrôleur 512-bit de ce dernier adressant individuellement 4 canaux HBM pour arriver aux 32 qu'impliquent les 4 Go embarqués.

 

Notons d'ailleurs que ces canaux fonctionnement de manière asynchrone, ceux ne transmettant pas de données passant automatiquement en veille, engendrant donc des économies d'énergie. Gros avantage de la concentration des puces HBM autour du GPU via l'interposer, le PCB de la carte s'en trouve largement simplifié puisqu'il n'est plus nécessaire de tracer sur le PCB les canaux mémoire. Inconvénient actuel, pas plus de 4 Go pour Fiji, ce qui n'est pas un problème en soi (à part peut-être en multi-GPU pour les très hautes définitions), mais alors autant éviter de communiquer sur le fait que les R9 390X sont bien meilleures que les GTX 980 parce qu'elles embarquent 8 Go au lieu de 4, non ?   

 

comparo taille hbm

Un vrai gain de place sur le PCB

 

Second avantage de la proximité (mais aussi de la fréquence moindre) des puces mémoires et du GPU, de nombreux transistors peuvent être économisés (filtrage du signal, redondance, etc.) ce qui conduit AMD à affirmer que l'espace occupé par les contrôleurs mémoire sur Fiji est moindre que pour Hawaii. La consommation de la HBM étant en baisse par rapport à la GDDR5, cela permet de réallouer une partie de l'enveloppe thermique (de la carte) anciennement dévolue à la mémoire, au GPU. Qui plus est, les puces HBM permettent d'accroitre la surface d'échange proche du GPU avec le refroidisseur et donc l'efficacité de ce dernier.

 

Dernier point sur les fonctionnalités, AMD a bien mis à jour l'UVD qui permet à présent la prise en charge hardware du décodage H265, ce n'est pas le cas du moteur de gestion vidéo qui reste cantonné à l'HDMI 1.4, alors que la norme 2.0 est disponible depuis un bon moment et prise en charge par les GTX 900. Au final, Fiji est un GPU énorme de 598 mm² (une taille comparable aux 601mm² du GM200) pour 8.9 Milliards de transistors (8 pour le concurrent). A cela, il faut ajouter la taille conséquente de l'interposer qui dépasse les 10 cm², ce qui avec la primeur (synonyme de tarif élevé) de la HBM, doit faire de Fiji un GPU relativement onéreux à produire...

 

fiji

Le monstrueux Die Fiji accompagné de sa HBM sur l'interposer

 

Passons page suivante à la première carte graphique utilisant cet ambitieux GPU à savoir la RADEON R9 Fury X.



Un poil avant ?

Microsoft veut un événement mondial pour la sortie de Windows 10

Un peu plus tard ...

Un peu de gameplay pour Star Wars Battlefront

Les 60 ragots
Les ragots sont actuellement
verrouillage dossierouverts aux ragoteurs logués