Geekbench inaugure son benchmark IA, un nouveau ring pour NPU

Core Ultra 5 245K : 13 refs en stock Tendance baissière
Core i5-14600k : 8 refs en stock Tendance baissière
Core Ultra 7 265K : 14 refs en stock Tendance baissière
Core i5-14700k : 18 refs en stock Tendance haussière
Core Ultra 9 285K : 2 refs en stock Tendance stable
Tendance stable
RTX 4060 ti : 202 refs en stock Tendance haussière
Ryzen 9600X : 1 ref en stock Tendance stable
RTX 4070 SUPER : 136 refs en stock Tendance haussière
RTX 4070 TI SUPER : 105 refs en stock Tendance haussière
RTX 4080 SUPER : 52 refs en stock Tendance baissière
Ryzen 9700X : 5 refs en stock Tendance baissière
Ryzen 7 7700X : 4 refs en stock Tendance stable
Ryzen 9 7800X3D : 5 refs en stock Tendance haussière
ryzen 9800X3D : 3 refs en stock Tendance haussière
RTX 4090 : 5 refs en stock Tendance baissière
RX 7600 : 24 refs en stock Tendance haussière
RX 7700 XT : 30 refs en stock Tendance haussière
Ryzen 9 7950X3D : 4 refs en stock Tendance stable
RX 7800 XT : 28 refs en stock Tendance haussière
RX 7900 XT : 32 refs en stock Tendance haussière
PS5 Pro : 5 refs en stock Tendance stable

La réception • Actualités • IA & VR

Nous ne vous ferons pas l’affront de vous présenter Geekbench, l’un des plus célèbres benchmarks multi-plateformes pour jauger des performances CPU et accessoirement GPU (via les tests OpenCL, Vulkan et Metal) des processeurs.

Cela fait maintenant deux ou trois générations que ces puces intègrent des NPU (neural processing unit), mais les Ryzen AI 300, Core Lunar Lake et Snapdragon X Series ont véritablement commencé à mettre l’emphase sur cet aspect. Primate Labs a donc jugé le moment opportun pour dégainer Geekbench AI, la version 1.0 d'un benchmark jusqu’ici appelé Geekbench ML dans sa version preview (testée depuis 2021) ; une appellation forcément plus explicite pour le grand public.

geekbench a1 score

Un benchmark IA multi-platerforme

Le benchmark est disponible pour Windows, Linux, macOS, iOS et Android. Vous trouverez ci-dessous les versions minimales, avec les frameworks et compilateurs pris en charge.

Plateforme	Version min.	API	Compilateur
Android	Android 12	TensorFlow Lite	Clang 16
iOS	iOS 17	CoreML	Xcode 15
Linux	Ubuntu 22.04 LTS	TensorFlow Lite, ONNX, OpenVINO	Clang 16
macOS	MacOS 14	CoreML	Xcode 15
Windows	Windows 10	ONNX, OpenVINO	Clang 16

À l'instar d’autres tests Geekbench, Geekbench AI fournit plusieurs scores. Trois en l’occurrence : Full Precision, Half Precision et Quantized. Comme pour les tests CPU et GPU, le benchmark effectue plusieurs mesures de puissance de calcul « brute » via différents sous-tests.

Seulement pour jauger des performances IA, il ne suffit pas de relever le temps de parcours ; il faut s'assurer que le concurrent passe la bonne ligne d'arrivée. Autrement dit, il faut également tenir compte de l’exactitude.

« Les performances de l'IA ne dépendent pas seulement de la rapidité d'exécution d'une charge de travail donnée, mais aussi de la proximité de ses résultats avec la vérité — en d'autres termes, de la précision avec laquelle ce modèle peut faire ce qu'il est censé faire », explicite Primate Labs. La société donne l’exemple d’un modèle de détection d'objets de type hot-dog. Elle indique que si celui-ci s’exécute très rapidement, mais qu’il ne peut détecter avec précision un hot-dog que dans 0,2 % des cas, il n'est en réalité pas très performant. En conséquence, Geekbench AI inclut une mesure de la précision. L’entreprise argue que celle-ci peut aussi aider les développeurs à voir les avantages et les inconvénients des différents types de données, lesquelles peuvent augmenter les performances et l'efficacité au détriment de la précision.

mesure geekbench ai 1

Pour le moment, l’évaluation des capacités IA des NPU intégrés aux puces grand public se borne essentiellement à une guerre de TOPS, une sorte de foire où chacun revendique le plus gros TOPS. Espérons que Geekbench AI, et d’autres benchmarks tiers, vont permettre de jauger des performances par un prisme plus objectif.

Pour consulter le communiqué et la documentation (PDF), suivez les liens.

Un poil avant ?

Test des Ryzen 9 9900X et 9950X sortis du bois (et ils envoient aussi du bois)

Un peu plus tard ...

SiFive présente le P870-D, pour des processeurs RISC-V à 256 cœurs

De Geekbench ML à Geekbench AI. un benchmark multi-plateforme qui mesure à la fois les perfs et la précision.

2 minutes

Sur le comptoir, au ~même sujet

	Steel Nomad, le nouveau benchmark de 3DMark, classe 40 cartes graphiques
	Basemark annonce Breaking Limit, un benchmark ray tracing multiplateforme (MAJ)
	L’Arc B580 fait ses gammes dans des benchmarks, la RTX 4060 battue ?
	Lunar Lake : pleine gamme et marée de benchmarks
	Le 7600X dans Userbenchmark fait mal aux CPU actuels
	Comptoiroscope • Sackboy, analyse vidéo et benchmark
	Le Snapdragon X Elite s’échauffe dans Geekbench : au niveau des promesses de Qualcomm ?
	Geekbench essaye un nouveau premier ministre pour gouverner les Ryzen (MAJ)
	Le plus petit et le plus gros Raphael testés dans Geekbench
	Un Raptor sous Geekbench, ça mord, mais pas trop !
	Test • Intel Core i9-12900K/12900F / i7-12700K / i5-12600K/12600/12400F & Z690/B660
	Test • GeForce GTX 970 & 980