8#include <gtest/gtest.h>
10#include "arccore/base/PlatformUtils.h"
12#include "arccore/trace/ITraceMng.h"
14#include "arccore/common/accelerator/Runner.h"
15#include "arccore/common/accelerator/RunQueue.h"
16#include "arccore/common/NumArray.h"
17#include "arccore/common/accelerator/Memory.h"
22#include "arccore/accelerator/AcceleratorInitializer.h"
24#include "./TestCommon.h"
36_testCooperativeLaunch_GridSync(
RunQueue queue, Int32 nb_value,
37 Int32 nb_loop1, Int32 nb_loop2);
41 Int32 nb_value, Int32 nb_loop);
44 Int32 nb_value, Int32 nb_loop);
46void _doTestCooperativeLaunch(
bool use_accelerator, Int32 max_allowed_thread)
49 Runner runner(x.executionPolicy());
51 if (queue.isAcceleratorPolicy())
54 Int32 nb_value = 1000000;
55 Int64 expected_value = 1000004000000;
58 expected_value = 100000040000000;
65 if (!queue.isAcceleratorPolicy()) {
76 tm->
info() <<
"Using accelerator policy name=" << queue.executionPolicy() <<
" nb_loop=" << nb_loop;
80 host_c.resize(nb_value);
82 for (Int32 i = 0; i < nb_value; ++i) {
83 host_c(i) = (i + 2) + (i + 3);
90 for (Int32 k = 1; k < 5; ++k) {
91 Int32 nb_loop1 = 10000;
93 _testCooperativeLaunch_GridSync(queue, nb_value, nb_loop1, nb_loop2);
95 for (Int32 k = 1; k < 5; ++k) {
96 Int32 nb_loop1 = 1000;
98 _testCooperativeLaunch_GridSync(queue, nb_value, nb_loop1, nb_loop2);
100 for (Int32 k = 1; k < 5; ++k) {
101 Int32 nb_loop1 = 100;
103 _testCooperativeLaunch_GridSync(queue, nb_value, nb_loop1, nb_loop2);
105 for (Int32 k = 1; k < 5; ++k) {
107 Int32 nb_loop2 = 999;
108 _testCooperativeLaunch_GridSync(queue, nb_value, nb_loop1, nb_loop2);
111 for (Int32 k = 1; k < 5; ++k) {
113 Int64 v = _testCooperativeLaunch(queue, c, nb_value, nb_loop);
114 Int64 v2 = v / nb_loop;
115 ASSERT_EQ(v2, expected_value);
119 for (Int32 k = 1; k < 5; ++k) {
121 Int64 v = _testCooperativeLaunch2(queue, c, nb_value, nb_loop);
122 Int64 v2 = v / nb_loop;
123 ASSERT_EQ(v2, expected_value);
128ARCCORE_TEST_DO_TEST_ACCELERATOR(ArccoreAccelerator, TestCooperativeLaunch, _doTestCooperativeLaunch);
Types et fonctions pour gérer les synchronisations sur les accélérateurs.
Types et macros pour gérer les boucles sur les accélérateurs.
Classe pour initialiser un runtime pour l'API accélérateur.
File d'exécution pour un accélérateur.
Gestionnaire d'exécution pour accélérateur.
Interface du gestionnaire de traces.
virtual TraceMessage info()=0
Flot pour un message d'information.
Tableaux multi-dimensionnels pour les types numériques accessibles sur accélérateurs.
Vue d'un tableau d'éléments de type T.
Espace de nom pour l'utilisation des accélérateurs.
RunQueue makeQueue(const Runner &runner)
Créé une file associée à runner.
-*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-
ARCCORE_BASE_EXPORT bool arccoreIsDebug()
Vrai si la macro ARCCORE_DEBUG est définie.
eMemoryResource
Liste des ressources mémoire disponibles.
@ Device
Alloue sur le device.