FAQ CUDA
FAQ CUDAConsultez toutes les FAQ
Nombre d'auteurs : 1, nombre de questions : 43, dernière mise à jour : 16 juin 2021
En anglais, TPC (Texture Processor Cluster).
Il s'agit, en fait, d'un processeur de shaders.
Cette unité de calcul est constituée d'une unité de traitement des textures (en abrégé : TEX, pour l'anglais Texture) et de deux multiprocesseurs de flux (en abrégé : SM, pour l'anglais Streaming Multiprocessor), pour les unités principales.
Elle contient aussi un contrôleur de multiprocesseurs de flux (en abrégé : SMC, pour l'anglais Streaming Multiprocessor Controller), un contrôleur de géométrie, un cache de niveau 1 pour les textures qui seront utilisées par les kernels et un cache de niveau 2 pour les instructions et les constantes.
Lien : Unité de traitement des textures (TEX)
Lien : Multiprocesseur (de flux) (SM)
En anglais, TEX (Texture Processing Unit).
Un TEX est disponible dans chaque TPC, et est accompagné de deux SM. Elle contient aussi quatre générateurs d'adresses de texture (en abrégé : TA, pour l'anglais Texture Adress Generator) et huit unités de filtrage de texture (en abrégé : TF, pour l'anglais Texture Filter Unit).
Les TA servent à donner des adresses aux textures, en fonction de leur taille, pour qu'elles ne se piétinent jamais.
Les TF servent à effectuer les filtrages des textures. Lors de l'accès à un élément d'une texture, quand les coordonnées sont normalisées (entre 0.0 et 1.0), il arrive qu'un élément n'existe pas. Il existe deux modes de filtrage : un premier renvoie l'élément le plus proche, un autre, une interpolation des éléments alentours.
Lien : Cluster d'unité de traitement des textures (TPC)
Lien : Multiprocesseur (de flux) (SM)
En anglais, SM (Streaming Multiprocessor).
Deux SM sont disponibles dans chaque TPC.
Cette unité de calcul est constituée d'une unité de traitement des textures (en abrégé : TEX, pour l'anglais Texture) et de deux multiprocesseurs de flux (en abrégé : SM, pour l'anglais Streaming Multiprocessor), pour les unités principales.
Aussi, chaque SM dispose d'un cache de niveau 1 pour les constantes et d'un autre cache de niveau 1 pour les instructions, remplis par le cache de niveau 2 du TPC.
Chaque SM est accompagné d'un fichier de registres (en abrégé : RF, pour Register File), qui contient 8192 registres de 32 bits.
C'est aussi à ce niveau qu'est située la mémoire partagée de 16 ko.
Un SM peut exécuter un bloc à la fois, un bloc ne sera pas divisé dans plusieurs multiprocesseurs.
Lien : Cluster d'unité de traitement des textures (TPC)
Lien : Processeur de flux (SP)
Lien : Unité superfonctionnelle (SFU)
Lien : Bloc (selon CUDA)
En anglais, SP (Streaming Processor).
Les SP vont toujours par deux dans un SM. Chacun des SP est accompagné d'un RF, de 1024 registres de 32 bits. 4 SP sont associés à un SFU.
Un SP peut exécuter une instruction par cycle. Ces instructions sont du type MAD : addition et multiplication, ou bien des conversions.
Parmi tous les éléments des TPC, seuls les SP et les SFU effectuent réellement des calculs. Tous les autres ne font que rassembler sous une appellation des composants.
Lien : Cluster d'unité de traitement des textures (TPC)
Lien : Multiprocesseur de flux (SM)
Lien : Unité superfonctionnelle (SFU)
En anglais, SFU (Super Function Unit).
Un SFU est associé à quatre SP.
Un SFU effectue une opération sur quatre cycles. Ces opérations peuvent être des opérations trigonométriques (sinus, cosinus), logarithmiques (en base 2)…
Parmi tous les éléments des TPC, seuls les SP et les SFU effectuent réellement des calculs. Tous les autres ne font que rassembler sous une appellation des composants.
Lien : Cluster d'unité de traitement des textures (TPC)
Lien : Multiprocesseur de flux (SM)
Lien : Processeur de flux (SP)