Les processeurs ARM ont un futur prometteur pour le HPC
Selon une analyse détaillée des superordinateurs anglais
Le 2018-07-05 21:44:06, par dourouc05, Responsable Qt & Livres
À l’instar de l’Espagne, le Royaume-Uni s’est lancé dans l’analyse de plusieurs types de processeurs pour ses futurs superordinateurs. Notamment, Isambard (un superordinateur en cours de construction) utilisera uniquement des puces ARM, des Cavium ThunderX2 précisément, afin d’évaluer cette technologie. Ce choix n’est pas dénué de sens : l’architecture ARM est très utilisée dans le monde de l’embarqué (notamment pour les téléphones portables) pour sa bonne performance avec une efficacité énergétique très haute. Le Japon ne s’y est pas trompé, son prochain superordinateur l’exploitera.
Isambard est une machine de dix mille processeurs ARM (moins puissante qu’Astra, récemment déployée aux États-Unis). Son exploitant, GW4 (un rassemblement de quatre universités anglaises), l’a comparée aux supercalculateurs existants sur différentes mesures.
Leurs résultats montrent que, en termes de puissance brute, l’architecture ARM n’est pas la plus compétitive, mais qu’elle pourrait se tailler une part de marché importante. Trois processeurs sont en lice : Cavium ThunderX2 (ARM, trente-deux cœurs), Intel Xeon Broadwell (x86, vingt-deux cœurs) et Intel Xeon Skylake (x86, vingt-huit cœurs).
La comparaison indique, sans surprise, que les processeurs d’Intel sont bien meilleurs quand il s’agit d’effectuer des opérations en virgule flottante. Notamment, la génération Skylake propose les instructions AVX2, qui peuvent travailler sur des vecteurs de cinq cent douze bits d’un seul coup : côté ARM, cette longueur est limitée à cent vingt-huit bits (deux nombres en virgule flottante avec une double précision, la plus utilisée en calcul scientifique).
Au contraire, les processeurs Intel sont déficients du côté de la mémoire : la bande passante du ThunderX2 est presque vingt-cinq pour cent supérieure à celle de la génération Skylake. De fait, le ThunderX2 dispose de huit canaux d’accès à la mémoire (six côté Skylake). Les caches sont souvent à l’avantage des processeurs Intel. Ceci signifie que ces derniers sont préférables pour tous les codes de calcul extrêmement intenses en opérations en virgule flottante (idéalement, toutes les données pouvant tenir dans les caches), mais pas en opérations mémoire, où le ThunderX2 brille bien plus.
Un autre avantage des processeurs ARM est leur prix. Bien que celui des processeurs utilisés pour Isambard n’a pas été dévoilé, il a été décrit comme “réduit d’un facteur deux à trois”. Le rapport performance-prix est donc bien plus intéressant — un facteur qui sera privilégié par certains acteurs de moindre taille.
La conclusion principale de cette analyse est que les processeurs ARM ont toute leur place dans les infrastructures HPC modernes, selon les cas d’utilisation prévus. Il est illusoire d’espérer obtenir une puce parfaite, capable d’effectuer un très grand nombre d’opérations par seconde et de disposer d’un très grand nombre de canaux d’accès à la mémoire, puisque le nombre de transistors est limité par processeur (à moins d’augmenter fortement la quantité de silicium qui est utilisée, ce qui ferait grimper fortement les prix).
Source : Benchmarks in Hand, UK Academics See Promising Future for Arm Chips in HPC.
Isambard est une machine de dix mille processeurs ARM (moins puissante qu’Astra, récemment déployée aux États-Unis). Son exploitant, GW4 (un rassemblement de quatre universités anglaises), l’a comparée aux supercalculateurs existants sur différentes mesures.
Leurs résultats montrent que, en termes de puissance brute, l’architecture ARM n’est pas la plus compétitive, mais qu’elle pourrait se tailler une part de marché importante. Trois processeurs sont en lice : Cavium ThunderX2 (ARM, trente-deux cœurs), Intel Xeon Broadwell (x86, vingt-deux cœurs) et Intel Xeon Skylake (x86, vingt-huit cœurs).
La comparaison indique, sans surprise, que les processeurs d’Intel sont bien meilleurs quand il s’agit d’effectuer des opérations en virgule flottante. Notamment, la génération Skylake propose les instructions AVX2, qui peuvent travailler sur des vecteurs de cinq cent douze bits d’un seul coup : côté ARM, cette longueur est limitée à cent vingt-huit bits (deux nombres en virgule flottante avec une double précision, la plus utilisée en calcul scientifique).
Au contraire, les processeurs Intel sont déficients du côté de la mémoire : la bande passante du ThunderX2 est presque vingt-cinq pour cent supérieure à celle de la génération Skylake. De fait, le ThunderX2 dispose de huit canaux d’accès à la mémoire (six côté Skylake). Les caches sont souvent à l’avantage des processeurs Intel. Ceci signifie que ces derniers sont préférables pour tous les codes de calcul extrêmement intenses en opérations en virgule flottante (idéalement, toutes les données pouvant tenir dans les caches), mais pas en opérations mémoire, où le ThunderX2 brille bien plus.
Un autre avantage des processeurs ARM est leur prix. Bien que celui des processeurs utilisés pour Isambard n’a pas été dévoilé, il a été décrit comme “réduit d’un facteur deux à trois”. Le rapport performance-prix est donc bien plus intéressant — un facteur qui sera privilégié par certains acteurs de moindre taille.
La conclusion principale de cette analyse est que les processeurs ARM ont toute leur place dans les infrastructures HPC modernes, selon les cas d’utilisation prévus. Il est illusoire d’espérer obtenir une puce parfaite, capable d’effectuer un très grand nombre d’opérations par seconde et de disposer d’un très grand nombre de canaux d’accès à la mémoire, puisque le nombre de transistors est limité par processeur (à moins d’augmenter fortement la quantité de silicium qui est utilisée, ce qui ferait grimper fortement les prix).
Source : Benchmarks in Hand, UK Academics See Promising Future for Arm Chips in HPC.
-
ShigruMNouveau Candidat au Clubdans un futur lointain dans ce cas, parceque aujourd'hui ....
les perf sont tres médiocre !
Le HPC c'est pas juste un cpu puissant (si on peut qualifier les cpu arm de puissant)
c'est aussi un grand parc applicatif de lib ultra optimisé ! et intel domine sans partage ce monde. C'est la raison pour laquelle Nvidia a abandonné ce marché.
Aujourd'hui nvidia est partis sur le deeplearning car il n'ya rien a dévelpper, il suffit juste de rendre ces processeur comptible avec les frameworks les plus utulisé (tensorflow) et c'est tous.
pas de kernel, pas de lib mpi, pas de compilateur a développer rien.
et enfin dernier point, le jour ou Intel se sentira en danger, il baissera ces tarifs tous simplement, aujourd'hui Intel fait de grosses marge sur ces cpu, ils peuvent facilement réduire un peu leurs marge sans menacer la boite, la R&D et les actionnaires pour garder leurs monopole.
Moi déja j'attends toujours déja les retous des fameux pc arm avec windows 10.
ARM c'est de belle promesse mais souvent piur un résultat tres decevant des que l'on quitte la basse conso et que l'on s'attaque au marché du pc/serveur/hpcle 06/07/2018 à 8:14 -
FirwenMembre expérimentédans un futur lointain dans ce cas, parceque aujourd'hui ....
les perf sont tres médiocre !
Le ThunderX2 est un processeur déja disponible et il n'a pas grand chose à envier à un Skylake Gold / Platinium haut de gamme d'Intel.
https://www.anandtech.com/show/12694...server-realityle 06/07/2018 à 10:16 -
ShigruMNouveau Candidat au Clubtres mauvais dans les bench Stream, HPL, et Petrobras
Il ne faut pas regarder la perf du cpu, mais la perf des lib. Dna sle monde HPC on utilise Inyel MPI, on utile Intel Compiler car openmpi et gcc sont de la grosse merde.
Intel dommine sans partage sur l'optimisation, es tévidement cela ne marche que sur de l'intel (parfois sur de l'amd aussi mais c'est pas tres légale) le 06/07/2018 à 17:28