Map contenant l'occupation idéale pour un kernel donné. Plus de détails...

Graphe de collaboration de Arcane::Accelerator::Cuda::OccupancyMap:

Fonctions membres publiques
Int32	getNbThreadPerBlock (const void *kernel_ptr)

Attributs privés
std::unordered_map< const void *, Int32 >	m_nb_thread_per_block_map

std::mutex	m_mutex

Description détaillée

Map contenant l'occupation idéale pour un kernel donné.

Note: Pour l'instant, on ne supporte pas d'avoir une valeur non nulle pour la quantité de mémoire partagée.

En cas d'erreur dans le calcul, on retourne une valeur de zéro.

Définition à la ligne 460 du fichier CudaAcceleratorRuntime.cc.

Documentation des fonctions membres

Int32 Arcane::Accelerator::Cuda::OccupancyMap::getNbThreadPerBlock ( const void * kernel_ptr )

inline

Définition à la ligne 464 du fichier CudaAcceleratorRuntime.cc.

std::mutex Arcane::Accelerator::Cuda::OccupancyMap::m_mutex

private

Définition à la ligne 500 du fichier CudaAcceleratorRuntime.cc.

std::unordered_map<const void*, Int32> Arcane::Accelerator::Cuda::OccupancyMap::m_nb_thread_per_block_map

private

Définition à la ligne 499 du fichier CudaAcceleratorRuntime.cc.

La documentation de cette classe a été générée à partir du fichier suivant :