d8/d40/GenericFilterer_8h_source.html

// -*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-

//-----------------------------------------------------------------------------

// Copyright 2000-2025 CEA (www.cea.fr) IFPEN (www.ifpenergiesnouvelles.com)

// See the top-level COPYRIGHT file for details.

// SPDX-License-Identifier: Apache-2.0

//-----------------------------------------------------------------------------

/*---------------------------------------------------------------------------*/

/* GenericFilterer.h                                           (C) 2000-2025 */

/*                                                                           */

/* Algorithme de filtrage.                                                   */

/*---------------------------------------------------------------------------*/

#ifndef ARCANE_ACCELERATOR_GENERICFILTERER_H

#define ARCANE_ACCELERATOR_GENERICFILTERER_H

/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


#include "arcane/utils/ArrayView.h"

#include "arcane/utils/FatalErrorException.h"

#include "arcane/utils/NumArray.h"

#include "arcane/utils/TraceInfo.h"


#include "arcane/accelerator/core/RunQueue.h"


#include "arcane/accelerator/AcceleratorGlobal.h"

#include "arcane/accelerator/CommonUtils.h"

#include "arcane/accelerator/RunCommandLaunchInfo.h"

#include "arcane/accelerator/RunCommandLoop.h"

#include "arcane/accelerator/ScanImpl.h"

#include "arcane/accelerator/MultiThreadAlgo.h"


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


namespace Arcane::Accelerator::impl

{

//#define ARCANE_USE_SCAN_ONEDPL


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


class ARCANE_ACCELERATOR_EXPORT GenericFilteringBase

{

  template <typename DataType, typename FlagType, typename OutputDataType>

  friend class GenericFilteringFlag;

  friend class GenericFilteringIf;

  friend class SyclGenericFilteringImpl;


 public:


 protected:


  GenericFilteringBase();


 protected:


  Int32 _nbOutputElement();

  void _allocate();

  void _allocateTemporaryStorage(size_t size);

  int* _getDeviceNbOutPointer();

  void _copyDeviceNbOutToHostNbOut();

  void _setCalled();

  bool _checkEmpty(Int32 nb_value);


 protected:


  RunQueue m_queue;

  // Mémoire de travail pour l'algorithme de filtrage.

  GenericDeviceStorage m_algo_storage;

  DeviceStorage<int> m_device_nb_out_storage;

  NumArray<Int32, MDDim1> m_host_nb_out_storage;

  bool m_use_direct_host_storage = true;


  bool m_is_already_called = false;

};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


#if defined(ARCANE_COMPILING_SYCL)

class SyclGenericFilteringImpl

{

 public:


  template <typename SelectLambda, typename InputIterator, typename OutputIterator>

  static void apply(GenericFilteringBase& s, Int32 nb_item, InputIterator input_iter,

                    OutputIterator output_iter, SelectLambda select_lambda)

  {

    RunQueue queue = s.m_queue;

    using DataType = std::iterator_traits<OutputIterator>::value_type;

#if defined(ARCANE_USE_SCAN_ONEDPL) && defined(__INTEL_LLVM_COMPILER)

    sycl::queue true_queue = AcceleratorUtils::toSyclNativeStream(queue);

    auto policy = oneapi::dpl::execution::make_device_policy(true_queue);

    auto out_iter = oneapi::dpl::copy_if(policy, input_iter, input_iter + nb_item, output_iter, select_lambda);

    Int32 nb_output = out_iter - output_iter;

    s.m_host_nb_out_storage[0] = nb_output;

#else

    NumArray<Int32, MDDim1> scan_input_data(nb_item);

    NumArray<Int32, MDDim1> scan_output_data(nb_item);

    SmallSpan<Int32> in_scan_data = scan_input_data.to1DSmallSpan();

    SmallSpan<Int32> out_scan_data = scan_output_data.to1DSmallSpan();

    {

      auto command = makeCommand(queue);

      command << RUNCOMMAND_LOOP1(iter, nb_item)

      {

        auto [i] = iter();

        in_scan_data[i] = select_lambda(input_iter[i]) ? 1 : 0;

      };

    }

    queue.barrier();

    SyclScanner<false /*is_exclusive*/, Int32, ScannerSumOperator<Int32>> scanner;

    scanner.doScan(queue, in_scan_data, out_scan_data, 0);

    // La valeur de 'out_data' pour le dernier élément (nb_item-1) contient la taille du filtre

    Int32 nb_output = out_scan_data[nb_item - 1];

    s.m_host_nb_out_storage[0] = nb_output;


    const bool do_verbose = false;

    if (do_verbose && nb_item < 1500)

      for (int i = 0; i < nb_item; ++i) {

        std::cout << "out_data i=" << i << " out_data=" << out_scan_data[i]

                  << " in_data=" << in_scan_data[i] << " value=" << input_iter[i] << "\n ";

      }

    // Copie depuis 'out_data' vers 'in_data' les indices correspondant au filtre

    // Comme 'output_iter' et 'input_iter' peuvent se chevaucher, il

    // faut faire une copie intermédiaire

    // TODO: détecter cela et ne faire la copie que si nécessaire.

    NumArray<DataType,MDDim1> out_copy(eMemoryRessource::Device);

    out_copy.resize(nb_output);

    auto out_copy_view = out_copy.to1DSpan();

    {

      auto command = makeCommand(queue);

      command << RUNCOMMAND_LOOP1(iter, nb_item)

      {

        auto [i] = iter();

        if (in_scan_data[i] == 1)

          out_copy_view[out_scan_data[i] - 1] = input_iter[i];

      };

    }

    {

      auto command = makeCommand(queue);

      command << RUNCOMMAND_LOOP1(iter, nb_output)

      {

        auto [i] = iter();

        output_iter[i] = out_copy_view[i];

      };

    }

    // Obligatoire à cause de 'out_copy'. On pourra le supprimer avec une

    // allocation temporaire.

    queue.barrier();

#endif

  }

};

#endif


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/

template <typename DataType, typename FlagType, typename OutputDataType>


class GenericFilteringFlag

{

 public:


  void apply(GenericFilteringBase& s, SmallSpan<const DataType> input,

             SmallSpan<OutputDataType> output, SmallSpan<const FlagType> flag)

  {

    const Int32 nb_item = input.size();

    if (output.size() != nb_item)

      ARCANE_FATAL("Sizes are not equals: input={0} output={1}", nb_item, output.size());

    [[maybe_unused]] const DataType* input_data = input.data();

    [[maybe_unused]] DataType* output_data = output.data();

    [[maybe_unused]] const FlagType* flag_data = flag.data();

    eExecutionPolicy exec_policy = eExecutionPolicy::Sequential;

    RunQueue queue = s.m_queue;

    exec_policy = queue.executionPolicy();

    switch (exec_policy) {

#if defined(ARCANE_COMPILING_CUDA)

    case eExecutionPolicy::CUDA: {

      size_t temp_storage_size = 0;

      cudaStream_t stream = AcceleratorUtils::toCudaNativeStream(queue);

      // Premier appel pour connaitre la taille pour l'allocation

      int* nb_out_ptr = nullptr;

      ARCANE_CHECK_CUDA(::cub::DeviceSelect::Flagged(nullptr, temp_storage_size,

                                                     input_data, flag_data, output_data, nb_out_ptr, nb_item, stream));


      s._allocateTemporaryStorage(temp_storage_size);

      nb_out_ptr = s._getDeviceNbOutPointer();

      ARCANE_CHECK_CUDA(::cub::DeviceSelect::Flagged(s.m_algo_storage.address(), temp_storage_size,

                                                     input_data, flag_data, output_data, nb_out_ptr, nb_item, stream));

      s._copyDeviceNbOutToHostNbOut();

    } break;

#endif

#if defined(ARCANE_COMPILING_HIP)

    case eExecutionPolicy::HIP: {

      size_t temp_storage_size = 0;

      // Premier appel pour connaitre la taille pour l'allocation

      hipStream_t stream = AcceleratorUtils::toHipNativeStream(queue);

      int* nb_out_ptr = nullptr;

      ARCANE_CHECK_HIP(rocprim::select(nullptr, temp_storage_size, input_data, flag_data, output_data,

                                       nb_out_ptr, nb_item, stream));


      s._allocateTemporaryStorage(temp_storage_size);

      nb_out_ptr = s._getDeviceNbOutPointer();


      ARCANE_CHECK_HIP(rocprim::select(s.m_algo_storage.address(), temp_storage_size, input_data, flag_data, output_data,

                                       nb_out_ptr, nb_item, stream));

      s._copyDeviceNbOutToHostNbOut();

    } break;

#endif

#if defined(ARCANE_COMPILING_SYCL)

    case eExecutionPolicy::SYCL: {

      impl::IndexIterator iter2(0);

      auto filter_lambda = [=](Int32 input_index) -> bool { return flag[input_index] != 0; };

      auto setter_lambda = [=](Int32 input_index, Int32 output_index) { output[output_index] = input[input_index]; };

      impl::SetterLambdaIterator<decltype(setter_lambda)> out(setter_lambda);

      SyclGenericFilteringImpl::apply(s, nb_item, iter2, out, filter_lambda);

    } break;

#endif

    case eExecutionPolicy::Thread:

      // Pas encore implémenté en multi-thread

      [[fallthrough]];

    case eExecutionPolicy::Sequential: {

      Int32 index = 0;

      for (Int32 i = 0; i < nb_item; ++i) {

        if (flag[i] != 0) {

          output[index] = input[i];

          ++index;

        }

      }

      s.m_host_nb_out_storage[0] = index;

    } break;

    default:

      ARCANE_FATAL(getBadPolicyMessage(exec_policy));

    }

  }

};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


class GenericFilteringIf

{

 public:


  template <bool InPlace, typename SelectLambda, typename InputIterator, typename OutputIterator>


  void apply(GenericFilteringBase& s, Int32 nb_item, InputIterator input_iter, OutputIterator output_iter,

             const SelectLambda& select_lambda, const TraceInfo& trace_info)

  {

    eExecutionPolicy exec_policy = eExecutionPolicy::Sequential;

    RunQueue queue = s.m_queue;

    exec_policy = queue.executionPolicy();

    RunCommand command = makeCommand(queue);

    command << trace_info;

    impl::RunCommandLaunchInfo launch_info(command, nb_item);

    launch_info.beginExecute();

    switch (exec_policy) {

#if defined(ARCANE_COMPILING_CUDA)

    case eExecutionPolicy::CUDA: {

      size_t temp_storage_size = 0;

      cudaStream_t stream = impl::CudaUtils::toNativeStream(queue);

      // Premier appel pour connaitre la taille pour l'allocation

      int* nb_out_ptr = nullptr;

      if constexpr (InPlace)

        ARCANE_CHECK_CUDA(::cub::DeviceSelect::If(nullptr, temp_storage_size,

                                                  input_iter, nb_out_ptr, nb_item,

                                                  select_lambda, stream));

      else

        ARCANE_CHECK_CUDA(::cub::DeviceSelect::If(nullptr, temp_storage_size,

                                                  input_iter, output_iter, nb_out_ptr, nb_item,

                                                  select_lambda, stream));


      s._allocateTemporaryStorage(temp_storage_size);

      nb_out_ptr = s._getDeviceNbOutPointer();

      if constexpr (InPlace)

        ARCANE_CHECK_CUDA(::cub::DeviceSelect::If(s.m_algo_storage.address(), temp_storage_size,

                                                  input_iter, nb_out_ptr, nb_item,

                                                  select_lambda, stream));

      else

        ARCANE_CHECK_CUDA(::cub::DeviceSelect::If(s.m_algo_storage.address(), temp_storage_size,

                                                  input_iter, output_iter, nb_out_ptr, nb_item,

                                                  select_lambda, stream));


      s._copyDeviceNbOutToHostNbOut();

    } break;

#endif

#if defined(ARCANE_COMPILING_HIP)

    case eExecutionPolicy::HIP: {

      size_t temp_storage_size = 0;

      // Premier appel pour connaitre la taille pour l'allocation

      hipStream_t stream = impl::HipUtils::toNativeStream(queue);

      int* nb_out_ptr = nullptr;

      // NOTE: il n'y a pas de version spécifique de 'select' en-place.

      // A priori il est possible que \a input_iter et \a output_iter

      // aient la même valeur.

      ARCANE_CHECK_HIP(rocprim::select(nullptr, temp_storage_size, input_iter, output_iter,

                                       nb_out_ptr, nb_item, select_lambda, stream));

      s._allocateTemporaryStorage(temp_storage_size);

      nb_out_ptr = s._getDeviceNbOutPointer();

      ARCANE_CHECK_HIP(rocprim::select(s.m_algo_storage.address(), temp_storage_size, input_iter, output_iter,

                                       nb_out_ptr, nb_item, select_lambda, 0));

      s._copyDeviceNbOutToHostNbOut();

    } break;

#endif

#if defined(ARCANE_COMPILING_SYCL)

    case eExecutionPolicy::SYCL: {

      SyclGenericFilteringImpl::apply(s, nb_item, input_iter, output_iter, select_lambda);

    } break;

#endif

    case eExecutionPolicy::Thread:

      if (nb_item > 500) {

        MultiThreadAlgo scanner;

        Int32 v = scanner.doFilter<InPlace>(launch_info.loopRunInfo(), nb_item, input_iter, output_iter, select_lambda);

        s.m_host_nb_out_storage[0] = v;

        break;

      }

      [[fallthrough]];

    case eExecutionPolicy::Sequential: {

      Int32 index = 0;

      for (Int32 i = 0; i < nb_item; ++i) {

        if (select_lambda(*input_iter)) {

          *output_iter = *input_iter;

          ++index;

          ++output_iter;

        }

        ++input_iter;

      }

      s.m_host_nb_out_storage[0] = index;

    } break;

    default:

      ARCANE_FATAL(getBadPolicyMessage(exec_policy));

    }

    launch_info.endExecute();

  }


};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


} // namespace Arcane::Accelerator::impl


namespace Arcane::Accelerator

{


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


class GenericFilterer

: private impl::GenericFilteringBase

{


 public:


  ARCANE_DEPRECATED_REASON("Y2024: Use GenericFilterer(const RunQueue&) instead")


  explicit GenericFilterer(RunQueue* queue)

  {

    ARCANE_CHECK_POINTER(queue);

    m_queue = *queue;

    _allocate();

  }


  explicit GenericFilterer(const RunQueue& queue)

  {

    m_queue = queue;

    _allocate();

  }


 public:


  template <typename InputDataType, typename OutputDataType, typename FlagType>


  void apply(SmallSpan<const InputDataType> input, SmallSpan<OutputDataType> output, SmallSpan<const FlagType> flag)

  {

    const Int32 nb_value = input.size();

    if (output.size() != nb_value)

      ARCANE_FATAL("Sizes are not equals: input={0} output={1}", nb_value, output.size());

    if (flag.size() != nb_value)

      ARCANE_FATAL("Sizes are not equals: input={0} flag={1}", nb_value, flag.size());


    if (_checkEmpty(nb_value))

      return;

    _setCalled();

    impl::GenericFilteringBase* base_ptr = this;

    impl::GenericFilteringFlag<InputDataType, FlagType, OutputDataType> gf;

    gf.apply(*base_ptr, input, output, flag);

  }


  template <typename DataType, typename SelectLambda>


  void applyIf(SmallSpan<const DataType> input, SmallSpan<DataType> output,

               const SelectLambda& select_lambda, const TraceInfo& trace_info = TraceInfo())

  {

    const Int32 nb_value = input.size();

    if (output.size() != nb_value)

      ARCANE_FATAL("Sizes are not equals: input={0} output={1}", nb_value, output.size());

    if (input.data() == output.data())

      ARCANE_FATAL("Input and Output are the same. Use in place overload instead");

    if (_checkEmpty(nb_value))

      return;

    _setCalled();

    impl::GenericFilteringBase* base_ptr = this;

    impl::GenericFilteringIf gf;

    gf.apply<false>(*base_ptr, nb_value, input.data(), output.data(), select_lambda, trace_info);

  }


  template <typename DataType, typename SelectLambda>


  void applyIf(SmallSpan<DataType> input_output, const SelectLambda& select_lambda,

               const TraceInfo& trace_info = TraceInfo())

  {

    const Int32 nb_value = input_output.size();

    if (_checkEmpty(nb_value))

      return;

    _setCalled();

    impl::GenericFilteringBase* base_ptr = this;

    impl::GenericFilteringIf gf;

    gf.apply<true>(*base_ptr, nb_value, input_output.data(), input_output.data(), select_lambda, trace_info);

  }


  template <typename InputIterator, typename OutputIterator, typename SelectLambda>


  void applyIf(Int32 nb_value, InputIterator input_iter, OutputIterator output_iter,

               const SelectLambda& select_lambda, const TraceInfo& trace_info = TraceInfo())

  {

    if (_checkEmpty(nb_value))

      return;

    _setCalled();

    impl::GenericFilteringBase* base_ptr = this;

    impl::GenericFilteringIf gf;

    gf.apply<false>(*base_ptr, nb_value, input_iter, output_iter, select_lambda, trace_info);

  }


  template <typename SelectLambda, typename SetterLambda>


  void applyWithIndex(Int32 nb_value, const SelectLambda& select_lambda,

                      const SetterLambda& setter_lambda, const TraceInfo& trace_info = TraceInfo())

  {

    if (_checkEmpty(nb_value))

      return;

    _setCalled();

    impl::GenericFilteringBase* base_ptr = this;

    impl::GenericFilteringIf gf;

    impl::IndexIterator input_iter;

    impl::SetterLambdaIterator<SetterLambda> out(setter_lambda);

    gf.apply<false>(*base_ptr, nb_value, input_iter, out, select_lambda, trace_info);

  }


  Int32 nbOutputElement()

  {

    return _nbOutputElement();

  }


};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


} // namespace Arcane::Accelerator


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


#endif


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/

ARCANE_CHECK_POINTER
#define ARCANE_CHECK_POINTER(ptr)
Macro retournant le pointeur ptr s'il est non nul ou lancant une exception s'il est nul.
Definition ArcaneGlobal.h:827

ARCANE_FATAL
#define ARCANE_FATAL(...)
Macro envoyant une exception FatalErrorException.
Definition ArcaneGlobal.h:768

RunCommandLoop.h
Types et macros pour gérer les boucles sur les accélérateurs.

RUNCOMMAND_LOOP1
#define RUNCOMMAND_LOOP1(iter_name, x1,...)
Boucle sur accélérateur avec arguments supplémentaires pour les réductions.
Definition RunCommandLoop.h:235

Arcane::Accelerator::GenericFilterer::applyIf
void applyIf(Int32 nb_value, InputIterator input_iter, OutputIterator output_iter, const SelectLambda &select_lambda, const TraceInfo &trace_info=TraceInfo())
Applique un filtre.
Definition GenericFilterer.h:538

Arcane::Accelerator::GenericFilterer::applyWithIndex
void applyWithIndex(Int32 nb_value, const SelectLambda &select_lambda, const SetterLambda &setter_lambda, const TraceInfo &trace_info=TraceInfo())
Applique un filtre avec une sélection suivant un index.
Definition GenericFilterer.h:583

Arcane::Accelerator::GenericFilterer::GenericFilterer
GenericFilterer(RunQueue *queue)
Créé une instance.
Definition GenericFilterer.h:395

Arcane::Accelerator::GenericFilterer::applyIf
void applyIf(SmallSpan< DataType > input_output, const SelectLambda &select_lambda, const TraceInfo &trace_info=TraceInfo())
Applique un filtre en place.
Definition GenericFilterer.h:515

Arcane::Accelerator::GenericFilterer::apply
void apply(SmallSpan< const InputDataType > input, SmallSpan< OutputDataType > output, SmallSpan< const FlagType > flag)
Applique un filtre.
Definition GenericFilterer.h:439

Arcane::Accelerator::GenericFilterer::applyIf
void applyIf(SmallSpan< const DataType > input, SmallSpan< DataType > output, const SelectLambda &select_lambda, const TraceInfo &trace_info=TraceInfo())
Applique un filtre.
Definition GenericFilterer.h:491

Arcane::Accelerator::GenericFilterer::nbOutputElement
Int32 nbOutputElement()
Nombre d'éléments en sortie.
Definition GenericFilterer.h:597

Arcane::Accelerator::GenericFilterer::GenericFilterer
GenericFilterer(const RunQueue &queue)
Créé une instance.
Definition GenericFilterer.h:407

Arcane::Accelerator::RunCommand
Gestion d'une commande sur accélérateur.
Definition core/RunCommand.h:46

Arcane::Accelerator::RunQueue
File d'exécution pour un accélérateur.
Definition core/RunQueue.h:52

Arcane::Accelerator::RunQueue::barrier
void barrier() const
Bloque tant que toutes les commandes associées à la file ne sont pas terminées.
Definition RunQueue.cc:159

Arcane::Accelerator::RunQueue::executionPolicy
eExecutionPolicy executionPolicy() const
Politique d'exécution de la file.
Definition RunQueue.cc:169

Arcane::Accelerator::impl::DeviceStorage
Gère l'allocation interne sur le device pour un type donné.
Definition CommonUtils.h:156

Arcane::Accelerator::impl::GenericDeviceStorage
Gère l'allocation interne sur le device.
Definition CommonUtils.h:95

Arcane::Accelerator::impl::GenericFilteringBase
Classe de base pour effectuer un filtrage.
Definition GenericFilterer.h:47

Arcane::Accelerator::impl::GenericFilteringBase::m_device_nb_out_storage
DeviceStorage< int > m_device_nb_out_storage
Mémoire sur le device du nombre de valeurs filtrées.
Definition GenericFilterer.h:77

Arcane::Accelerator::impl::GenericFilteringBase::m_is_already_called
bool m_is_already_called
Indique si un appel est en cours.
Definition GenericFilterer.h:90

Arcane::Accelerator::impl::GenericFilteringBase::m_host_nb_out_storage
NumArray< Int32, MDDim1 > m_host_nb_out_storage
Mémoire hôte pour le nombre de valeurs filtrées.
Definition GenericFilterer.h:79

Arcane::Accelerator::impl::GenericFilteringBase::m_queue
RunQueue m_queue
File d'exécution. Ne doit pas être nulle.
Definition GenericFilterer.h:73

Arcane::Accelerator::impl::GenericFilteringBase::m_use_direct_host_storage
bool m_use_direct_host_storage
Indique quelle mémoire est utilisée pour le nombre de valeurs filtrées.
Definition GenericFilterer.h:87

Arcane::Accelerator::impl::GenericFilteringFlag
Classe pour effectuer un filtrage.
Definition GenericFilterer.h:183

Arcane::Accelerator::impl::GenericFilteringIf
Classe pour effectuer un filtrage.
Definition GenericFilterer.h:270

Arcane::Accelerator::impl::GenericFilteringIf::apply
void apply(GenericFilteringBase &s, Int32 nb_item, InputIterator input_iter, OutputIterator output_iter, const SelectLambda &select_lambda, const TraceInfo &trace_info)
Applique le filtre.
Definition GenericFilterer.h:280

Arcane::Accelerator::impl::IndexIterator
Itérateur sur un index.
Definition CommonUtils.h:183

Arcane::Accelerator::impl::MultiThreadAlgo
Algorithmes avancée en mode multi-thread.
Definition MultiThreadAlgo.h:37

Arcane::Accelerator::impl::RunCommandLaunchInfo
Object temporaire pour conserver les informations d'exécution d'une commande et regrouper les tests.
Definition core/RunCommandLaunchInfo.h:36

Arcane::Accelerator::impl::RunCommandLaunchInfo::beginExecute
void beginExecute()
Indique qu'on commence l'exécution de la commande.
Definition RunCommandLaunchInfo.cc:63

Arcane::Accelerator::impl::RunCommandLaunchInfo::endExecute
void endExecute()
Signale la fin de l'exécution.
Definition RunCommandLaunchInfo.cc:82

Arcane::Accelerator::impl::RunCommandLaunchInfo::loopRunInfo
const ForLoopRunInfo & loopRunInfo() const
Informations d'exécution de la boucle.
Definition core/RunCommandLaunchInfo.h:95

Arcane::Accelerator::impl::SetterLambdaIterator
Itérateur sur une lambda pour positionner une valeur via un index.
Definition CommonUtils.h:386

Arcane::NumArray
Tableaux multi-dimensionnels pour les types numériques accessibles sur accélérateurs.
Definition utils/NumArray.h:58

Arcane::NumArray::to1DSpan
Span< const DataType > to1DSpan() const
Vue 1D constante sur l'instance.
Definition utils/NumArray.h:663

Arcane::NumArray::to1DSmallSpan
constexpr SmallSpan< DataType > to1DSmallSpan()
Vue 1D sur l'instance (uniquement si rank == 1)
Definition utils/NumArray.h:679

Arcane::NumArray::resize
void resize(Int32 dim1_size)
Modifie la taille du tableau en gardant pas les valeurs actuelles.
Definition utils/NumArray.h:301

Arcane::SmallSpan
Vue d'un tableau d'éléments de type T.
Definition Span.h:673

Arcane::SpanImpl::size
constexpr __host__ __device__ SizeType size() const noexcept
Retourne la taille du tableau.
Definition Span.h:212

Arcane::SpanImpl::data
constexpr __host__ __device__ pointer data() const noexcept
Pointeur sur le début de la vue.
Definition Span.h:422

Arcane::TraceInfo
Informations de trace.
Definition arccore/src/base/arccore/base/TraceInfo.h:33

Arcane::Accelerator
Espace de nom pour l'utilisation des accélérateurs.
Definition AcceleratorGlobal.h:36

Arcane::Accelerator::makeCommand
RunCommand makeCommand(const RunQueue &run_queue)
Créé une commande associée à la file run_queue.
Definition core/RunQueue.h:283

Arcane::Accelerator::eExecutionPolicy
eExecutionPolicy
Politique d'exécution pour un Runner.
Definition AcceleratorCoreGlobal.h:93

Arcane::Accelerator::eExecutionPolicy::SYCL
@ SYCL
Politique d'exécution utilisant l'environnement SYCL.
Definition AcceleratorCoreGlobal.h:105

Arcane::Accelerator::eExecutionPolicy::HIP
@ HIP
Politique d'exécution utilisant l'environnement HIP.
Definition AcceleratorCoreGlobal.h:103

Arcane::Accelerator::eExecutionPolicy::CUDA
@ CUDA
Politique d'exécution utilisant l'environnement CUDA.
Definition AcceleratorCoreGlobal.h:101

Arcane::Accelerator::eExecutionPolicy::Sequential
@ Sequential
Politique d'exécution séquentielle.
Definition AcceleratorCoreGlobal.h:97

Arcane::Accelerator::eExecutionPolicy::Thread
@ Thread
Politique d'exécution multi-thread.
Definition AcceleratorCoreGlobal.h:99

Arcane::Int32
std::int32_t Int32
Type entier signé sur 32 bits.
Definition ArccoreGlobal.h:184