Opérateur de réduction. Plus de détails...
#include <arccore/accelerator/Reduce.h>
Fonctions membres publiques | |
| HostDeviceReducerBase (RunCommand &command) | |
| __host__ __device__ | HostDeviceReducerBase (const HostDeviceReducerBase &rhs) |
| __host__ __device__ | HostDeviceReducerBase (HostDeviceReducerBase &&rhs)=delete |
| HostDeviceReducerBase & | operator= (const HostDeviceReducerBase &rhs)=delete |
| __host__ __device__ void | setValue (DataType v) |
| __host__ __device__ DataType | localValue () const |
Fonctions membres protégées | |
| DataType | _reduce () |
| Effectue la réduction et récupère la valeur. ATTENTION: ne faire qu'une seule fois. | |
| __host__ __device__ void | _finalize () |
Attributs protégés | |
| impl::IReduceMemoryImpl * | m_memory_impl = nullptr |
| DataType * | m_host_or_device_memory_for_reduced_value = nullptr |
| Pointeur vers la donnée qui contiendra la valeur réduite. | |
| impl::IReduceMemoryImpl::GridMemoryInfo | m_grid_memory_info |
| DataType | m_local_value |
| DataType * | m_atomic_parent_value = nullptr |
| DataType | m_atomic_value |
Opérateur de réduction.
Cette classe permet de gérer une réduction sur accélérateur ou en multi-thread.
La réduction finale a lieu lors de l'appel à reduce(). Il ne faut donc faire cet appel qu'une seule fois et dans une partie collective. Cet appel n'est valide que sur les instance créées avec un constructeur vide. Ces dernières ne peuvent être créées que sur l'hôte.
NOTE sur l'implémentation
Sur GPU, les réductions sont effectuées dans le destructeur de la classe La valeur 'm_host_or_device_memory_for_reduced_value' sert à conserver ces valeurs. Sur l'hôte, on utilise un 'std::atomic' pour conserver la valeur commune entre les threads. Cette valeur est référencée par 'm_parent_value' et n'est valide que sur l'hôte.
Définition à la ligne 306 du fichier arccore/src/accelerator/arccore/accelerator/Reduce.h.
|
inline |
Définition à la ligne 310 du fichier arccore/src/accelerator/arccore/accelerator/Reduce.h.
|
inline |
Définition à la ligne 333 du fichier arccore/src/accelerator/arccore/accelerator/Reduce.h.
|
inlineprotected |
Définition à la ligne 436 du fichier arccore/src/accelerator/arccore/accelerator/Reduce.h.
|
inlineprotected |
Effectue la réduction et récupère la valeur. ATTENTION: ne faire qu'une seule fois.
Définition à la ligne 405 du fichier arccore/src/accelerator/arccore/accelerator/Reduce.h.
Références m_host_or_device_memory_for_reduced_value.
|
inline |
Définition à la ligne 369 du fichier arccore/src/accelerator/arccore/accelerator/Reduce.h.
|
inline |
Définition à la ligne 365 du fichier arccore/src/accelerator/arccore/accelerator/Reduce.h.
|
protected |
Définition à la ligne 393 du fichier arccore/src/accelerator/arccore/accelerator/Reduce.h.
|
mutableprotected |
Définition à la ligne 394 du fichier arccore/src/accelerator/arccore/accelerator/Reduce.h.
|
protected |
Définition à la ligne 384 du fichier arccore/src/accelerator/arccore/accelerator/Reduce.h.
|
protected |
Pointeur vers la donnée qui contiendra la valeur réduite.
Sur accélérateur, cette donnée est allouée sur le device. Sur CPU, il s'agit de l'adresse de m_local_value pour l'instance parente.
Définition à la ligne 383 du fichier arccore/src/accelerator/arccore/accelerator/Reduce.h.
Référencé par _reduce().
|
mutableprotected |
Définition à la ligne 392 du fichier arccore/src/accelerator/arccore/accelerator/Reduce.h.
|
protected |
Définition à la ligne 376 du fichier arccore/src/accelerator/arccore/accelerator/Reduce.h.