Arcane  v3.15.0.0
Documentation développeur
Chargement...
Recherche...
Aucune correspondance
GenericSorter.h
1// -*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-
2//-----------------------------------------------------------------------------
3// Copyright 2000-2024 CEA (www.cea.fr) IFPEN (www.ifpenergiesnouvelles.com)
4// See the top-level COPYRIGHT file for details.
5// SPDX-License-Identifier: Apache-2.0
6//-----------------------------------------------------------------------------
7/*---------------------------------------------------------------------------*/
8/* GenericSorter.h (C) 2000-2024 */
9/* */
10/* Algorithme de tri. */
11/*---------------------------------------------------------------------------*/
12#ifndef ARCANE_ACCELERATOR_GENERICSORTER_H
13#define ARCANE_ACCELERATOR_GENERICSORTER_H
14/*---------------------------------------------------------------------------*/
15/*---------------------------------------------------------------------------*/
16
17#include "arcane/utils/ArrayView.h"
18#include "arcane/utils/FatalErrorException.h"
19#include "arcane/utils/NumArray.h"
20
21#include "arcane/accelerator/AcceleratorGlobal.h"
22#include "arcane/accelerator/core/RunQueue.h"
23#include "arcane/accelerator/CommonUtils.h"
24
25#include <algorithm>
26
27/*---------------------------------------------------------------------------*/
28/*---------------------------------------------------------------------------*/
29
30namespace Arcane::Accelerator::impl
31{
32
33/*---------------------------------------------------------------------------*/
34/*---------------------------------------------------------------------------*/
41class ARCANE_ACCELERATOR_EXPORT GenericSorterBase
42{
43 friend class GenericSorterMergeSort;
44
45 public:
46
47 explicit GenericSorterBase(const RunQueue& queue);
48
49 protected:
50
51 RunQueue m_queue;
52 GenericDeviceStorage m_algo_storage;
53};
54
55/*---------------------------------------------------------------------------*/
56/*---------------------------------------------------------------------------*/
64{
65 // TODO: Faire le malloc sur le device associé à la queue.
66 // et aussi regarder si on peut utiliser mallocAsync().
67
68 public:
69
70 template <typename CompareLambda, typename InputIterator, typename OutputIterator>
73 {
74 RunQueue queue = s.m_queue;
76 switch (exec_policy) {
77#if defined(ARCANE_COMPILING_CUDA)
79 size_t temp_storage_size = 0;
80 cudaStream_t stream = impl::CudaUtils::toNativeStream(&queue);
81 // Premier appel pour connaitre la taille pour l'allocation
82 ARCANE_CHECK_CUDA(::cub::DeviceMergeSort::SortKeysCopy(nullptr, temp_storage_size,
84 compare_lambda, stream));
85
86 s.m_algo_storage.allocate(temp_storage_size);
87 ARCANE_CHECK_CUDA(::cub::DeviceMergeSort::SortKeysCopy(s.m_algo_storage.address(), temp_storage_size,
89 compare_lambda, stream));
90 } break;
91#endif
92#if defined(ARCANE_COMPILING_HIP)
94 size_t temp_storage_size = 0;
95 hipStream_t stream = impl::HipUtils::toNativeStream(&queue);
96 // Premier appel pour connaitre la taille pour l'allocation
97 ARCANE_CHECK_HIP(rocprim::merge_sort(nullptr, temp_storage_size, input_iter, output_iter,
98 nb_item, compare_lambda, stream));
99
100 s.m_algo_storage.allocate(temp_storage_size);
101
102 ARCANE_CHECK_HIP(rocprim::merge_sort(s.m_algo_storage.address(), temp_storage_size, input_iter, output_iter,
103 nb_item, compare_lambda, stream));
104 } break;
105#endif
107 // Pas encore implémenté en multi-thread
108 [[fallthrough]];
110 // Copie input dans output
112 for (Int32 i = 0; i < nb_item; ++i) {
114 ++output_iter;
115 ++input_iter;
116 }
118 } break;
119 default:
120 ARCANE_FATAL(getBadPolicyMessage(exec_policy));
121 }
122 }
123};
124
125/*---------------------------------------------------------------------------*/
126/*---------------------------------------------------------------------------*/
127
128} // namespace Arcane::Accelerator::impl
129
130namespace Arcane::Accelerator
131{
132
133/*---------------------------------------------------------------------------*/
134/*---------------------------------------------------------------------------*/
142{
143 public:
144
145 explicit GenericSorter(const RunQueue& queue)
147 {
148 }
149
150 public:
151
160 template <typename DataType>
162 {
165 Int32 nb_item = input.size();
166 if (output.size() < nb_item)
167 ARCANE_FATAL("Output size '{0}' is smaller than input size '{1}'",
168 output.size(), nb_item);
169 auto compare_lambda = [] ARCCORE_HOST_DEVICE(const DataType& a, const DataType& b) {
170 return a < b;
171 };
172 gf.apply(*base_ptr, nb_item, input.data(), output.data(), compare_lambda);
173 }
174};
175
176/*---------------------------------------------------------------------------*/
177/*---------------------------------------------------------------------------*/
178
179} // namespace Arcane::Accelerator
180
181/*---------------------------------------------------------------------------*/
182/*---------------------------------------------------------------------------*/
183
184#endif
185
186/*---------------------------------------------------------------------------*/
187/*---------------------------------------------------------------------------*/
#define ARCANE_FATAL(...)
Macro envoyant une exception FatalErrorException.
Algorithme générique de tri sur accélérateur.
void apply(SmallSpan< const DataType > input, SmallSpan< DataType > output)
Tri les entités.
File d'exécution pour un accélérateur.
eExecutionPolicy executionPolicy() const
Politique d'exécution de la file.
Definition RunQueue.cc:169
Gère l'allocation interne sur le device.
Definition CommonUtils.h:95
Classe de base pour effectuer un tri.
Classe pour effectuer le tri d'une liste.
Lecteur des fichiers de maillage via la bibliothèque LIMA.
Definition Lima.cc:149
Espace de nom pour l'utilisation des accélérateurs.
eExecutionPolicy
Politique d'exécution pour un Runner.
@ HIP
Politique d'exécution utilisant l'environnement HIP.
@ CUDA
Politique d'exécution utilisant l'environnement CUDA.
@ Sequential
Politique d'exécution séquentielle.
@ Thread
Politique d'exécution multi-thread.
std::int32_t Int32
Type entier signé sur 32 bits.