Arcane  v4.1.3.0
Documentation développeur
Chargement...
Recherche...
Aucune correspondance
TestReduce1.cc
1// -*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-
2//-----------------------------------------------------------------------------
3// Copyright 2000-2026 CEA (www.cea.fr) IFPEN (www.ifpenergiesnouvelles.com)
4// See the top-level COPYRIGHT file for details.
5// SPDX-License-Identifier: Apache-2.0
6//-----------------------------------------------------------------------------
7
8#include <gtest/gtest.h>
9
10#include "arccore/base/PlatformUtils.h"
11
12#include "arccore/common/accelerator/Runner.h"
13#include "arccore/common/accelerator/RunQueue.h"
14#include "arccore/common/NumArray.h"
15
19#include "arccore/accelerator/internal/Initializer.h"
20
21#include "./TestCommon.h"
22
23/*---------------------------------------------------------------------------*/
24/*---------------------------------------------------------------------------*/
25
26using namespace Arcane;
27using namespace Arcane::Accelerator;
28
29/*---------------------------------------------------------------------------*/
30/*---------------------------------------------------------------------------*/
31
32extern "C++" Int64
33_testReduceDirect(RunQueue queue, SmallSpan<const Int64> c, Int32 nb_thread,
34 Int32 nb_value, Int32 nb_part, Int32 nb_loop, bool is_async);
35extern "C++" Int64
36_testReduceGridStride(RunQueue queue, SmallSpan<const Int64> c, Int32 nb_thread,
37 Int32 nb_value, Int32 nb_part, Int32 nb_loop, bool is_async);
38
39void _doTestReduceDirect(bool use_accelerator)
40{
41 Accelerator::Initializer x(use_accelerator, 0);
42 Runner runner(x.executionPolicy());
43 RunQueue queue(makeQueue(runner));
44 if (queue.isAcceleratorPolicy())
45 queue.setMemoryRessource(eMemoryResource::Device);
46 Int32 nb_loop = 1000;
47 Int32 nb_value = 1000000;
48 Int64 expected_value = 1000004000000;
49
50 nb_value = 10000000;
51 expected_value = 100000040000000;
52 nb_loop = 100;
53
54 Int32 nb_thread = 256;
55 Int32 nb_part = 1;
56 if (!queue.isAcceleratorPolicy()) {
57 if (arccoreIsDebug())
58 nb_loop /= 20;
59 else
60 nb_loop /= 4;
61 if (nb_loop == 0)
62 nb_loop = 1;
63 }
64 //nb_loop = 1;
65
66 std::cout << "Using accelerator policy name=" << queue.executionPolicy() << "\n";
67 std::cout << "Sizeof (ReducerSum2<Int64>) = " << sizeof(ReducerSum2<Int64>) << " nb_loop=" << nb_loop << "\n";
68
69 eMemoryResource mem = queue.memoryResource();
71 host_c.resize(nb_value);
72 {
73 for (Int32 i = 0; i < nb_value; ++i) {
74 host_c(i) = (i + 2) + (i + 3);
75 };
76 }
77
79 c.copy(host_c);
80
81 nb_part = 1;
82 for (Int32 k = 1; k < 5; ++k) {
83 {
84 Int64 v = _testReduceDirect(queue, c, nb_thread, nb_value, nb_part, nb_loop, false);
85 Int64 v2 = v / nb_loop;
86 ASSERT_EQ(v2, expected_value);
87 }
88 {
89 Int64 v = _testReduceDirect(queue, c, nb_thread, nb_value, nb_part, nb_loop, true);
90 Int64 v2 = v / nb_loop;
91 ASSERT_EQ(v2, expected_value);
92 }
93 nb_part *= 2;
94 }
95
96 nb_part = 1;
97 for (Int32 k = 1; k < 5; ++k) {
98 {
99 Int64 v = _testReduceGridStride(queue, c, nb_thread, nb_value, nb_part, nb_loop, false);
100 Int64 v2 = v / nb_loop;
101 ASSERT_EQ(v2, expected_value);
102 }
103 {
104 Int64 v = _testReduceGridStride(queue, c, nb_thread, nb_value, nb_part, nb_loop, true);
105 Int64 v2 = v / nb_loop;
106 ASSERT_EQ(v2, expected_value);
107 }
108 nb_part *= 2;
109 }
110}
111
112ARCCORE_TEST_DO_TEST_ACCELERATOR(ArccoreAccelerator, TestReduceDirect, _doTestReduceDirect);
113
114/*---------------------------------------------------------------------------*/
115/*---------------------------------------------------------------------------*/
Types et fonctions pour gérer les synchronisations sur les accélérateurs.
Types et macros pour gérer les boucles sur les accélérateurs.
Classe pour initialiser le runtime accélérateur.
Definition Initializer.h:31
Gestionnaire d'exécution pour accélérateur.
Tableaux multi-dimensionnels pour les types numériques accessibles sur accélérateurs.
Vue d'un tableau d'éléments de type T.
Definition Span.h:801
Espace de nom pour l'utilisation des accélérateurs.
RunQueue makeQueue(const Runner &runner)
Créé une file associée à runner.
-*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-
ARCCORE_BASE_EXPORT bool arccoreIsDebug()
Vrai si la macro ARCCORE_DEBUG est définie.
eMemoryResource
Liste des ressources mémoire disponibles.
@ Host
Alloue sur l'hôte.
@ Device
Alloue sur le device.