Test • GeFORCE GTX 1050 vs RADEON RX 560 |
————— 07 Août 2017
Test • GeFORCE GTX 1050 vs RADEON RX 560 |
————— 07 Août 2017
Les cartes que nous allons tester ce jour réutilisent des GPU déjà usités l'an passé, c'est pourquoi nous nous contenterons de brefs rappels à ce niveau. La GTX 1050 n'est pas une nouvelle carte puisque commercialisée fin octobre dernier en même temps que le modèle Ti, l'absence de sample (et de disponibilité ensuite nous concernant) nous avait toutefois empêché de la tester jusqu'alors. Voilà pour une rapide mise en contexte, passons sans tarder au premier GPU de ce dossier.
Avant de décrire la RADEON RX 560 que nous nous sommes procurés, quelques petits rappels sur son GPU étrenné lors du lancement des RX 460 il y a un an. Ce dernier se "contente" de 123 mm² pour 3 milliards de transistors, soit un peu plus de la moité de son grand frère Ellesmere (232 mm² / 5,7 Mrds). Pour les détails de l'architecture, nous vous invitons à vous référer à la page qui lui est dédiée dans le dossier RX 480.
Le diagramme logique de Baffin et son nouveau packaging réduit - Cliquer pour agrandir
Sa taille réduite permet d'abaisser significativement les coûts de production (plus de GPU par wafer). Pour ce faire, il n'emploie plus que deux Shader Engine (4 pour Ellesmere) impliquant un débit maximum de 2 triangles par cycle. Au sein de ceux-ci, le nombre de CU (Compute Unit, intégrant chacune 64 unités de calcul et 4 TMU pour le texturing) est légèrement réduit par rapport à son grand frère en passant de 9 à 8 pour un total de 16 dans un P11 intégral, soit 1024 unités de calcul et 64 TMU. Du côté interface mémoire et cache, là aussi en comparaison de P10, tout est divisé par deux avec 16 ROP, un cache L2 à 1 Mo et un bus 128-bit.
Il profite à l'instar de "l'autre" puce Polaris, de l'amélioration des algorithmes de compression couleur sans perte (Delta Color), ainsi que des contrôleurs mémoire révisés pour supporter des fréquences GDDR5 bien plus élevées (jusqu'à 2 GHz). Il est gravé en 14 nm par GlobalFoundries (procédé sous licence Samsung) et officiellement la RX 560 utilise un Polaris 21, contre P11 pour sa devancière. Gageons qu'il ne s'agit là que d'un artifice marketing pour générer de la nouveauté : les 2 puces doivent être identiques, mais le process de fabrication désormais plus mature permet des rendements supérieurs et des puces montant davantage en fréquence.
Passons à présent en revue les principales caractéristiques du GP107 qui est le concurrent désigné de Polaris 11/21. Il est légèrement plus grand que ce dernier à 132 mm² pour 3,3 milliards de transistors, une taille (+7%) et densité tout de même très proches de celles de Baffin. Par rapport à GM107 (148 mm² / 1,87 Mrds), cela permet de produire une puce 17 % plus petite, mais disposant de 75 % de transistors supplémentaires. C'est bien entendu l’architecture Pascal qui est à la manœuvre ; pour les détails concernant cette dernière, nous vous invitons à vous référer à la page qui lui est dédiée dans le dossier GTX 1070/1080.
En dehors de la taille et donc du nombre d'unités composant ce GPU, la principale différence avec les autres puces Pascal provient du process de gravure : en lieu et place du 16 nm de TSMC, le caméléon a opté pour le 14 nm de Samsung. De type FinFET (transistors "3D") également, il dispose d'un avantage d'environ 9 % au niveau de la densité. C'est ce procédé sous licence qui a été employé par GlobalFoundries pour la production des puces Polaris d'AMD.
Le diagramme logique du GP107
La taille réduite permet d'abaisser significativement les coûts de production (plus de GPU par wafer), reste à réaliser les arbitrages les plus pertinents possible quant à l’allocation des transistors pour un GPU de cet acabit. Le caméléon a utilisé une approche différente de celle qui avait été la sienne pour la précédente puce de cette gamme. Si le nombre de TPC/SM (Streaming Multiprocessor) ne connaît qu'une légère inflation (5 → 6), ces derniers sont à présent répartis au sein de 2 Graphics Processor Cluster au lieu d'un seul sur GM107, à raison de 3 par GPC contre 5 pour les autres puces Pascal.
Cela permet ainsi de doubler les unités de rastérisation (découpe triangles en pixels) et la génération de triangles par cycle (2). Du côté interface mémoire et cache, GP107 utilise 4 contrôleurs mémoire 32-bit et un cache L2 à 1 Mo tout en profitant à l'instar de toutes les puces Pascal, de l'amélioration des algorithmes de compression couleur sans perte (Delta Color). Les ROP sont doublés par rapport à GM107, à 32. En faisant les comptes, on obtient donc 768 unités chargées des calculs, 48 pour le texturing, un bus 128-bit et 32 ROP pour l'écriture mémoire.
Alors qu'il y a un an, AMD utilisait pour la RX 460 un GPU avec une partie de ses unités désactivée, ce n'est plus le cas de la RX 560 qui profite, cette fois, d'un Baffin bel et bien complet ! Chemin inverse pour NVIDIA en passant de la 1050 Ti à la 1050, le GP107 perd de son côté un SM. De quoi annoncer un duel plus serré entre ces deux-là, puisque la GTX 1050 Ti devançait de la tête et des épaules la RX 460 lors de notre test à l'époque. Voyons donc plus précisément les caractéristiques des cartes actuelles (et quelques passées) de cette gamme.
Cartes | Architecture | Fréquence GPU (MHz) | Fréquence Mémoire (MHz) | Unités de calcul | TMU | ROP | Taille mémoire (Go) | Bus mémoire (bits) | Calcul SP (Gflops) | Bande Passante (Go/s) |
---|---|---|---|---|---|---|---|---|---|---|
HD 7790 | GCN 2 | 1000 | 1500 | 896 | 56 | 16 | 1 | 128 |
1792 |
96 |
R7 260X | GCN 2 | 1100 | 1625 | 896 | 56 | 16 | 2 | 128 | 1971 | 104 |
R7 360 | GCN 2 | 1050 | 1625 | 768 | 48 | 16 | 2 | 128 | 1613 | 104 |
R7 370 | GCN 1 | 975 | 1400 | 1024 | 64 | 32 | 2 / 4 | 256 | 1997 | 179 |
RX 460 | GCN 4 | 1090 à 1200 | 1750 | 896 | 56 | 16 | 2 / 4 | 128 | 1953 à 2150 | 112 |
RX 560 | GCN 4 | 1175 à 1275 | 1750 | 1024 | 64 | 16 | 2 / 4 | 128 | 2406 à 2611 | 112 |
GTX 750 | Maxwell | 1019 à 1084 (mini) | 1250 | 512 | 32 | 16 | 1 | 128 | 1043 à 1110 | 80 |
GTX 750 Ti | Maxwell |
1019 à 1084 (mini) |
1350 | 640 | 40 | 16 | 2 | 128 | 1304 à 1388 | 86 |
GTX 950 | Maxwell 2 | 1024 à 1188 (mini) | 1650 | 768 | 48 | 32 | 2 / 4 | 128 | 1573 à 1825 | 106 |
GTX 1050 | Pascal | 1354 à 1455 (mini) | 1752 | 640 | 40 | 32 | 2 | 128 | 1733 à 1862 | 112 |
GTX 1050 Ti | Pascal | 1290 à 1392 (mini) | 1752 | 768 | 48 | 32 | 4 | 128 | 1981 à 2138 | 112 |
La GTX 1050 se "contente" donc d'un GPU dont un TPC/SM a été désactivé (-16,6%) par rapport à celui de la 1050 Ti. La fréquence de ce dernier est toutefois en hausse (théorique) de 62 MHz (+4.5%). La bande passante étant similaire, la GTX 1050 équipée de 2 Go (4 pour la Ti) de GDDR5, n'est donc pas très éloignée de sa grande sœur en termes de performances (pour peu que la quantité de mémoire ne soit pas un facteur limitant) et en conséquence mène la vie difficile à la RX 460. C'est pourquoi AMD s'est décidé à lancer la RX 560 disposant d'un GPU complet et un petit boost de fréquence pour proposer une puissance de calcul/texturing en hausse d'un peu plus de 20 %. De quoi revenir à niveau, voire dépasser la GTX 1050 ? C'est ce que nous allons tâcher de vérifier dans les pages suivantes.
|
Un poil avant ?Ryzen n'aimerait pas les compilations ? | Un peu plus tard ...MSi et GIGABYTE sortent deux cartes mères uniquement pour les puces Kaby Lake-X |