Lors de son traditionnel keynote au salon re:Invent, AWS a annoncé un certain nombre de nouveaux matériels dans son cloud, à commencer par une nouvelle version de son hyperviseur Nitro, de nouveaux types d'instances et une nouvelle version de ses puces Graviton personnalisées basées sur l'architecture Arm, qui a été spécifiquement conçue pour alimenter des charges de travail de calcul à haute performance.Cette nouvelle puce Graviton3E - une variante de la gamme Graviton existante - promet des améliorations significatives des performances, notamment une amélioration de 35 % des performances pour les charges de travail qui dépendent fortement des instructions vectorielles. Les processeurs AWS Graviton2 offrent une avancée majeure en matière de performances et de capacités comparés aux processeurs AWS Graviton de première génération.Les instances à technologie Graviton2 prennent en charge une large gamme de charges de travail polyvalentes, à capacité extensible, optimisées pour le calcul/la mémoire/le stockage et à calcul accéléré, notamment les serveurs d'applications, les microservices, le calcul haute performance (HPC), l'inférence de machine learning (ML) basée sur le CPU, l'encodage vidéo, l'Electronic Design Automation (EDA), les jeux, les bases de données open source et les caches en mémoire.De nombreux services AWS, notamment Amazon Aurora, Amazon ElastiCache, Amazon EMR, AWS Lambda et AWS Fargate, prennent également en charge les instances à technologie Graviton2, offrant ainsi une expérience entièrement gérée avec un rapport prix/performances très avantageux. Des milliers de clients, notamment Epic Games, DIRECTV, Intuit, Lyft et Formule 1 exécutent leurs charges de travail de production su les instances à technologie Graviton2.Les processeurs AWS Graviton3 sont la famille de processeurs AWS Graviton la plus récente. Ils offrent jusqu'à 25 % de performances de calcul en plus, jusqu'à deux fois plus de performances en virgule flottante et jusqu'à deux fois plus de performances de charges de travail cryptographiques par rapport aux processeurs AWS Graviton2.Les processeurs AWS Graviton3 offrent des performances jusqu'à 3 fois supérieures à celles des processeurs AWS Graviton2 pour les charges de travail ML, ainsi que la prise en charge du format bfloat16. Ils prennent également en charge la mémoire DDR5 qui offre une bande passante de 50 % supérieure à celle de la mémoire DDR4.Ces nouvelles puces alimenteront bien évidemment de nouveaux types d'instances AWS EC2, à commencer par celle logiquement baptisée Hpc7G. Ce nouveau type d'instance se déclinera en plusieurs tailles, avec jusqu'à 64 vCPU et 128 Go de mémoire. Il faudra toutefois attendre début 2023 pour que ces instances soient disponibles.Toutes ces nouvelles instances utiliseront le nouvel hyperviseur matériel Nitro 5 d'AWS, que la société a également annoncé. Nitro v5 promet une latence nettement améliorée, des performances par watt jusqu'à 40 % supérieures et des PPS 60 % plus élevés. L'équipe d'AWS a rendu ces résultats possibles en doublant le nombre de transistors dans les puces Nitro personnalisées.AWS a complètement réinventé l’infrastructure de virtualisation chez Amazon. En général, les hyperviseurs protègent le matériel physique et le Bios, virtualisent le processeur, le stockage et la mise en réseau, et fournissent un riche ensemble de fonctionnalités de gestion. Avec le système Nitro, Amazon est en mesure de séparer ces fonctions, de les décharger sur du matériel et des logiciels dédiés, et de réduire les coûts en fournissant toutes les ressources d'un serveur aux clients.« Les performances peuvent être difficiles à atteindre lorsque vous refusez de faire des concessions sur des aspects tels que la sécurité et le coût », a déclaré Peter DeSantis, vice-président senior d'AWS Utility Computing, lors de la keynote. Et à bien des égards, cela a longtemps été l'histoire de la plateforme informatique d'AWS et de son travail sur ses processeurs personnalisés.AWS a fait l'acquisition du fabricant de puces Annapurna Labs en 2015 afin de donner un coup de fouet à ses conceptions de puces maison, qui, au départ, étaient axées sur des tâches informatiques plus simples, telles que la fourniture de l'épine dorsale des sites Web. L'effort de calcul haute performance annoncé lors du salon AWS re:Invent lundi est un effort pour démontrer que la technologie interne d'Amazon peut rivaliser avec les puces des leaders de l'industrie.AWS souhaite augmenter le poids du deep learning pour les développeurs de tous les jours et démocratiser l'accès à l'infrastructure de pointe, le tout mis à disposition dans un modèle de paiement à l'usage à faible coût. AWS Inferentia est le premier accélérateur spécialement conçu pour accélérer les charges de travail de deep learning et qui appartient à une stratégie à long terme visant à concrétiser cette approche chez Amazon.Mardi, le directeur général d'AWS, Adam Selipsky, a également annoncé une nouvelle version de la puce Inferentia, conçue pour tirer des conclusions de grandes quantités de données. Inferentia2 est conçu pour traiter des ensembles de données plus importants que son prédécesseur, permettant des choses comme des images générées par des logiciels ou la détection et l'interprétation de la parole humaine, a déclaré Amazon.AWS Inferentia est conçu pour fournir des performances d'inférence élevées dans le cloud, réduire le coût total de l'inférence et permettre aux développeurs d'intégrer facilement le machine learning dans leurs applications métier. Le kit de développement logiciel (SDK) AWS Neuron comprend un compilateur ainsi que des outils d'exécution et de profilage qui permettent d'optimiser la performance des charges de travail pour AWS Inferentia.Les développeurs peuvent déployer des modèles de réseaux neuronaux complexes, construits et formés sur des frameworks courants, tels que Tensorflow, PyTorch et MXNet, et les déployer sur des instances Inf1 d'Amazon EC2 basées sur AWS Inferentia. Ils peuvent continuer à utiliser les mêmes frameworks ML qu'aujourd'hui et migrer les modèles vers Inf1 avec un minimum de modifications du code, sans être lié aux solutions d'un fournisseur.Les ordinateurs qui prédisent les schémas météorologiques et modélisent l'aérodynamisme des voitures de course font partie des systèmes les plus puissants exploités par des semi-conducteurs de pointe. Ces composants sont généralement fournis par Intel, Nvidia et AMD dans des systèmes informatiques coûteux que les entreprises, les services gouvernementaux et les établissements universitaires construisent dans leurs propres centres de données.La dernière version de la gamme de processeurs Graviton d'AWS, le Graviton3E, sera deux fois plus performante que les versions actuelles dans un type de calculs nécessaires aux ordinateurs à haute performance, a déclaré DeSantis. Combinée à d'autres technologies AWS, la nouvelle offre sera 20 % plus performante que la précédente.« La raison pour laquelle le calcul à haute performance n'est pas important est qu'il est difficile, a déclaré DeSantis. Il est difficile d'obtenir de la capacité, il est difficile d'obtenir du temps sur ce superordinateur. Ce qui nous enthousiasme, c'est d'apporter les capacités du calcul à haute performance à davantage de charges de travail. »Source : AmazonQue pense vous de Graviton3E, la nouvelle puce d'Amazon ?Quels avantages pourrait apporter cette puce ? Quels inconvénients ?Existe-t-il une autre alternative ?