Arcane  v3.16.8.0
Documentation développeur
Chargement...
Recherche...
Aucune correspondance
Référence de la classe Arcane::Accelerator::Cuda::OccupancyMap

Map contenant l'occupation idéale pour un kernel donné. Plus de détails...

+ Graphe de collaboration de Arcane::Accelerator::Cuda::OccupancyMap:

Fonctions membres publiques

Int32 getNbThreadPerBlock (const void *kernel_ptr)
 

Attributs privés

std::unordered_map< const void *, Int32 > m_nb_thread_per_block_map
 
std::mutex m_mutex
 

Description détaillée

Map contenant l'occupation idéale pour un kernel donné.

Note
Pour l'instant, on ne supporte pas d'avoir une valeur non nulle pour la quantité de mémoire partagée.

En cas d'erreur dans le calcul, on retourne une valeur de zéro.

Définition à la ligne 99 du fichier CudaAcceleratorRuntime.cc.

Documentation des fonctions membres

◆ getNbThreadPerBlock()

Int32 Arcane::Accelerator::Cuda::OccupancyMap::getNbThreadPerBlock ( const void * kernel_ptr)
inline

Définition à la ligne 103 du fichier CudaAcceleratorRuntime.cc.

Documentation des données membres

◆ m_mutex

std::mutex Arcane::Accelerator::Cuda::OccupancyMap::m_mutex
private

Définition à la ligne 134 du fichier CudaAcceleratorRuntime.cc.

◆ m_nb_thread_per_block_map

std::unordered_map<const void*, Int32> Arcane::Accelerator::Cuda::OccupancyMap::m_nb_thread_per_block_map
private

Définition à la ligne 133 du fichier CudaAcceleratorRuntime.cc.


La documentation de cette classe a été générée à partir du fichier suivant :