8#include <gtest/gtest.h>
10#include "arccore/base/PlatformUtils.h"
12#include "arccore/common/accelerator/Runner.h"
13#include "arccore/common/accelerator/RunQueue.h"
14#include "arccore/common/NumArray.h"
19#include "arccore/accelerator/internal/Initializer.h"
21#include "./TestCommon.h"
34 Int32 nb_value, Int32 nb_part, Int32 nb_loop,
bool is_async);
37 Int32 nb_value, Int32 nb_part, Int32 nb_loop,
bool is_async);
39void _doTestReduceDirect(
bool use_accelerator)
42 Runner runner(x.executionPolicy());
44 if (queue.isAcceleratorPolicy())
47 Int32 nb_value = 1000000;
48 Int64 expected_value = 1000004000000;
51 expected_value = 100000040000000;
54 Int32 nb_thread = 256;
56 if (!queue.isAcceleratorPolicy()) {
66 std::cout <<
"Using accelerator policy name=" << queue.executionPolicy() <<
"\n";
67 std::cout <<
"Sizeof (ReducerSum2<Int64>) = " <<
sizeof(
ReducerSum2<Int64>) <<
" nb_loop=" << nb_loop <<
"\n";
71 host_c.resize(nb_value);
73 for (Int32 i = 0; i < nb_value; ++i) {
74 host_c(i) = (i + 2) + (i + 3);
82 for (Int32 k = 1; k < 5; ++k) {
84 Int64 v = _testReduceDirect(queue, c, nb_thread, nb_value, nb_part, nb_loop,
false);
85 Int64 v2 = v / nb_loop;
86 ASSERT_EQ(v2, expected_value);
89 Int64 v = _testReduceDirect(queue, c, nb_thread, nb_value, nb_part, nb_loop,
true);
90 Int64 v2 = v / nb_loop;
91 ASSERT_EQ(v2, expected_value);
97 for (Int32 k = 1; k < 5; ++k) {
99 Int64 v = _testReduceGridStride(queue, c, nb_thread, nb_value, nb_part, nb_loop,
false);
100 Int64 v2 = v / nb_loop;
101 ASSERT_EQ(v2, expected_value);
104 Int64 v = _testReduceGridStride(queue, c, nb_thread, nb_value, nb_part, nb_loop,
true);
105 Int64 v2 = v / nb_loop;
106 ASSERT_EQ(v2, expected_value);
112ARCCORE_TEST_DO_TEST_ACCELERATOR(ArccoreAccelerator, TestReduceDirect, _doTestReduceDirect);
Types et fonctions pour gérer les synchronisations sur les accélérateurs.
Types et macros pour gérer les boucles sur les accélérateurs.
Classe pour initialiser le runtime accélérateur.
Classe pour effectuer une réduction 'somme'.
File d'exécution pour un accélérateur.
Gestionnaire d'exécution pour accélérateur.
Tableaux multi-dimensionnels pour les types numériques accessibles sur accélérateurs.
Vue d'un tableau d'éléments de type T.
Espace de nom pour l'utilisation des accélérateurs.
RunQueue makeQueue(const Runner &runner)
Créé une file associée à runner.
-*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-
ARCCORE_BASE_EXPORT bool arccoreIsDebug()
Vrai si la macro ARCCORE_DEBUG est définie.
eMemoryResource
Liste des ressources mémoire disponibles.
@ Device
Alloue sur le device.