IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Sortie de CUDA 10.1, l'interface de calcul sur carte graphique de NVIDIA
Avec une bibliothèque plus légère pour les produits matriciels

Le , par dourouc05

81PARTAGES

11  0 
Sortie de CUDA 10.1, l'interface de calcul sur carte graphique de NVIDIA,
avec une bibliothèque plus légère pour les produits matriciels

Moins de six mois après la sortie de CUDA 10.0, voici la première version mineure qui apporte une série de nouveautés. Notamment, cuBLASLt est une variante allégée de cuBLAS pour l'algèbre linéaire, spécialement focalisée sur le produit entre matrices (GEMM). Cette bibliothèque propose une API plus flexible que BLAS (une interface qui existe depuis 1990), notamment au niveau de la représentation en mémoire des matrices, peu importe le type des données (notamment en précision réduite, sur huit ou seize bits).

Les solveurs pour les valeurs propres ont également été revisités, avec des améliorations de performance leur permettant d'aller une fois et demi plus vite qu'avant. cuSOLVER propose aussi de nouveaux solveurs pour récupérer un sous-ensemble de valeurs propres ( SYEVDX et SYGVDX).

Côté génération de nombres aléatoires, six algorithmes ont été retravaillés (MTGP32, MRG32k3a, Sobol32 et Sobol64), avec une amélioration de performance qui peut monter jusqu'à un facteur quatre ! nvJPEG, une bibliothèque d'encodage et de décodage de fichiers JPEG, accélère fortement les opérations en lots.

Télécharger CUDA 10.1. Voir aussi les notes de version.

Une erreur dans cette actualité ? Signalez-nous-la !