d0/d04/GenericPartitioner_8h_source.html

// -*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-

//-----------------------------------------------------------------------------

// Copyright 2000-2025 CEA (www.cea.fr) IFPEN (www.ifpenergiesnouvelles.com)

// See the top-level COPYRIGHT file for details.

// SPDX-License-Identifier: Apache-2.0

//-----------------------------------------------------------------------------

/*---------------------------------------------------------------------------*/

/* GenericPartitioner.h                                        (C) 2000-2025 */

/*                                                                           */

/* Algorithme de partitionnement de liste.                                   */

/*---------------------------------------------------------------------------*/

#ifndef ARCANE_ACCELERATOR_GENERICPARTITIONER_H

#define ARCANE_ACCELERATOR_GENERICPARTITIONER_H

/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


#include "arcane/utils/ArrayView.h"

#include "arcane/utils/FatalErrorException.h"

#include "arcane/utils/NumArray.h"


#include "arcane/accelerator/AcceleratorGlobal.h"

#include "arcane/accelerator/core/RunQueue.h"

#include "arcane/accelerator/CommonUtils.h"

#include "arcane/accelerator/RunCommandLaunchInfo.h"

#if defined(ARCANE_COMPILING_SYCL)

#include "arcane/accelerator/RunCommandLoop.h"

#endif


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


namespace Arcane::Accelerator::impl

{


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/

/*!

 * \internal

 * \brief Classe de base pour effectuer un filtrage.

 *

 * Contient les arguments nécessaires pour effectuer le filtrage.

 */


class ARCANE_ACCELERATOR_EXPORT GenericPartitionerBase

{

  friend class GenericPartitionerIf;


 public:


  explicit GenericPartitionerBase(const RunQueue& queue);


 protected:


  Int32 _nbFirstPart() const;

  SmallSpan<const Int32> _nbParts() const;

  void _allocate();

  void _resetNbPart();


 protected:


  RunQueue m_queue;

  GenericDeviceStorage m_algo_storage;

  DeviceStorage<int, 2> m_device_nb_list1_storage;

  NumArray<Int32, MDDim1> m_host_nb_list1_storage;

};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/

/*!

 * \internal

 * \brief Classe pour effectuer un partitionnement d'une liste.

 */


class GenericPartitionerIf

{

 public:


  /*!

   * \brief Effectue le partitionnement d'une liste en deux parties.

   */

  template <typename SelectLambda, typename InputIterator, typename OutputIterator>


  void apply(GenericPartitionerBase& s, Int32 nb_item, InputIterator input_iter, OutputIterator output_iter,

             const SelectLambda& select_lambda, const TraceInfo& trace_info = TraceInfo())

  {

    RunQueue queue = s.m_queue;

    eExecutionPolicy exec_policy = queue.executionPolicy();

    RunCommand command = makeCommand(queue);

    command << trace_info;

    impl::RunCommandLaunchInfo launch_info(command, nb_item);

    launch_info.beginExecute();

    switch (exec_policy) {

#if defined(ARCANE_COMPILING_CUDA)

    case eExecutionPolicy::CUDA: {

      size_t temp_storage_size = 0;

      cudaStream_t stream = impl::CudaUtils::toNativeStream(&queue);

      // Premier appel pour connaitre la taille pour l'allocation

      int* nb_list1_ptr = nullptr;

      ARCANE_CHECK_CUDA(::cub::DevicePartition::If(nullptr, temp_storage_size,

                                                   input_iter, output_iter, nb_list1_ptr, nb_item,

                                                   select_lambda, stream));


      s.m_algo_storage.allocate(temp_storage_size);

      nb_list1_ptr = s.m_device_nb_list1_storage.allocate();

      ARCANE_CHECK_CUDA(::cub::DevicePartition::If(s.m_algo_storage.address(), temp_storage_size,

                                                   input_iter, output_iter, nb_list1_ptr, nb_item,

                                                   select_lambda, stream));

      s.m_device_nb_list1_storage.copyToAsync(s.m_host_nb_list1_storage, queue);

    } break;

#endif

#if defined(ARCANE_COMPILING_HIP)

    case eExecutionPolicy::HIP: {

      size_t temp_storage_size = 0;

      // Premier appel pour connaitre la taille pour l'allocation

      hipStream_t stream = impl::HipUtils::toNativeStream(&queue);

      int* nb_list1_ptr = nullptr;

      ARCANE_CHECK_HIP(rocprim::partition(nullptr, temp_storage_size, input_iter, output_iter,

                                          nb_list1_ptr, nb_item, select_lambda, stream));


      s.m_algo_storage.allocate(temp_storage_size);

      nb_list1_ptr = s.m_device_nb_list1_storage.allocate();


      ARCANE_CHECK_HIP(rocprim::partition(s.m_algo_storage.address(), temp_storage_size, input_iter, output_iter,

                                          nb_list1_ptr, nb_item, select_lambda, stream));

      s.m_device_nb_list1_storage.copyToAsync(s.m_host_nb_list1_storage, queue);

    } break;

#endif

#if defined(ARCANE_COMPILING_SYCL) && defined(__INTEL_LLVM_COMPILER)

    case eExecutionPolicy::SYCL: {

      // Seulement implémenté pour DPC++.

      // Actuellement (dpc++ 2025.0), il n'y a pas l'équivalent avec SYCL de

      // la méthode de partition de cub ou rocprim.

      // Utilise la fonction 'stable_partition'. Cependant, cette fonction

      // ne supporte pas si la mémoire uniquement sur accélérateur. De plus,

      // il faut que InputIterator et OutputIterator remplissent le concept

      // std::random_access_iterator ce qui n'est pas (notamment car il n'y a

      // pas les opérateurs de copie ni de constructeur vide à cause de la lambda).

      // Pour éviter tous ces problèmes, on alloue donc des tableaux temporaires

      // pour l'appel à 'stable_sort' et on recopie les valerus en sortie.

      using InputDataType = typename InputIterator::value_type;

      using DataType = typename OutputIterator::value_type;

      NumArray<DataType, MDDim1> tmp_output_numarray(nb_item);

      NumArray<bool, MDDim1> tmp_select_numarray(nb_item);

      auto tmp_output = tmp_output_numarray.to1DSmallSpan();

      auto tmp_select = tmp_select_numarray.to1DSmallSpan();

      {

        auto command = makeCommand(queue);

        command << RUNCOMMAND_LOOP1(iter, nb_item)

        {

          auto [i] = iter();

          tmp_output[i] = input_iter[i];

        };

      }

      auto tmp_select_lambda = [=](Int32 i) { return tmp_select[i]; };

      sycl::queue sycl_queue = impl::SyclUtils::toNativeStream(queue);

      auto policy = oneapi::dpl::execution::make_device_policy(sycl_queue);

      auto output_after = oneapi::dpl::stable_partition(policy, tmp_output.begin(), tmp_output.end(), select_lambda);

      queue.barrier();

      Int32 nb_list1 = (output_after - tmp_output.begin());

      Int32 nb_list2 = nb_item - nb_list1;

      s.m_host_nb_list1_storage[0] = nb_list1;

      //std::cerr << "NbList1=" << nb_list1 << " NbList2=" << nb_list2 << "\n";

      {

        // Recopie dans output les valeurs filtrées.

        // Pour être cohérent avec 'cub' et 'rocprim', il faut inverser l'ordre des

        // des valeurs de la liste pour les éléments ne remplissant pas la condition.

        // Pour cela, on fait une boucle de taille (nb_list1 + nb_list/2) et chaque

        // itération pour i>=nb_list1 gère deux éléments.

        auto command = makeCommand(queue);

        Int32 nb_iter2 = (nb_list2 / 2) + (nb_list2 % 2);

        //std::cout << "NB_ITER2=" << nb_iter2 << "\n";

        command << RUNCOMMAND_LOOP1(iter, (nb_list1 + nb_iter2))

        {

          auto [i] = iter();

          if (i >= nb_list1) {

            // Partie de la liste pour les valeurs ne remplissant par le critère.

            Int32 j = i - nb_list1;

            Int32 reverse_i = (nb_item - (j + 1));

            auto x1 = tmp_output[i];

            auto x2 = tmp_output[reverse_i];

            output_iter[i] = tmp_output[reverse_i];

            output_iter[reverse_i] = tmp_output[i];

          }

          else

            output_iter[i] = tmp_output[i];

        };

      }

      queue.barrier();

    } break;

#endif

    case eExecutionPolicy::Thread:

      // Pas encore implémenté en multi-thread

      [[fallthrough]];

    case eExecutionPolicy::Sequential: {

      auto saved_output_iter = output_iter;

      auto output2_iter = output_iter + nb_item;

      for (Int32 i = 0; i < nb_item; ++i) {

        auto v = *input_iter;

        if (select_lambda(v)) {

          *output_iter = v;

          ++output_iter;

        }

        else {

          --output2_iter;

          *output2_iter = v;

        }

        ++input_iter;

      }

      Int32 nb_list1 = static_cast<Int32>(output_iter - saved_output_iter);

      s.m_host_nb_list1_storage[0] = nb_list1;

    } break;

    default:

      ARCANE_FATAL(getBadPolicyMessage(exec_policy));

    }

    launch_info.endExecute();

  }


  /*!

   * \brief Effectue le partitionnement d'une liste en trois parties.

   */

  template <typename Select1Lambda, typename Select2Lambda,

            typename InputIterator, typename FirstOutputIterator,

            typename SecondOutputIterator, typename UnselectedIterator>


  void apply3(GenericPartitionerBase& s, Int32 nb_item,

              InputIterator input_iter,

              FirstOutputIterator first_output_iter,

              SecondOutputIterator second_output_iter,

              UnselectedIterator unselected_iter,

              const Select1Lambda& select1_lambda,

              const Select2Lambda& select2_lambda,

              const TraceInfo& trace_info = TraceInfo())

  {

    RunQueue queue = s.m_queue;

    eExecutionPolicy exec_policy = queue.executionPolicy();

    RunCommand command = makeCommand(queue);

    command << trace_info;

    impl::RunCommandLaunchInfo launch_info(command, nb_item);

    launch_info.beginExecute();

    switch (exec_policy) {

#if defined(ARCANE_COMPILING_CUDA)

    case eExecutionPolicy::CUDA: {

      size_t temp_storage_size = 0;

      cudaStream_t stream = impl::CudaUtils::toNativeStream(&queue);

      // Premier appel pour connaitre la taille pour l'allocation

      int* nb_list1_ptr = nullptr;

      ARCANE_CHECK_CUDA(::cub::DevicePartition::If(nullptr, temp_storage_size,

                                                   input_iter, first_output_iter, second_output_iter,

                                                   unselected_iter, nb_list1_ptr, nb_item,

                                                   select1_lambda, select2_lambda, stream));


      s.m_algo_storage.allocate(temp_storage_size);

      nb_list1_ptr = s.m_device_nb_list1_storage.allocate();

      ARCANE_CHECK_CUDA(::cub::DevicePartition::If(s.m_algo_storage.address(), temp_storage_size,

                                                   input_iter, first_output_iter, second_output_iter,

                                                   unselected_iter, nb_list1_ptr, nb_item,

                                                   select1_lambda, select2_lambda, stream));

      s.m_device_nb_list1_storage.copyToAsync(s.m_host_nb_list1_storage, queue);

    } break;

#endif

#if defined(ARCANE_COMPILING_HIP)

    case eExecutionPolicy::HIP: {

      size_t temp_storage_size = 0;

      // Premier appel pour connaitre la taille pour l'allocation

      hipStream_t stream = impl::HipUtils::toNativeStream(&queue);

      int* nb_list1_ptr = nullptr;

      using namespace rocprim;

      ARCANE_CHECK_HIP(::rocprim::partition_three_way(nullptr, temp_storage_size, input_iter, first_output_iter,

                                                      second_output_iter, unselected_iter,

                                                      nb_list1_ptr, nb_item, select1_lambda, select2_lambda, stream));


      s.m_algo_storage.allocate(temp_storage_size);

      nb_list1_ptr = s.m_device_nb_list1_storage.allocate();


      ARCANE_CHECK_HIP(partition_three_way(s.m_algo_storage.address(), temp_storage_size, input_iter, first_output_iter,

                                           second_output_iter, unselected_iter, nb_list1_ptr, nb_item,

                                           select1_lambda, select2_lambda, stream));

      s.m_device_nb_list1_storage.copyToAsync(s.m_host_nb_list1_storage, queue);

    } break;

#endif

    case eExecutionPolicy::Thread:

      // Pas encore implémenté en multi-thread

      [[fallthrough]];

    case eExecutionPolicy::Sequential: {

      Int32 nb_first = 0;

      Int32 nb_second = 0;

      for (Int32 i = 0; i < nb_item; ++i) {

        auto v = *input_iter;

        bool is_1 = select1_lambda(v);

        bool is_2 = select2_lambda(v);

        if (is_1) {

          *first_output_iter = v;

          ++first_output_iter;

          ++nb_first;

        }

        else {

          if (is_2) {

            *second_output_iter = v;

            ++second_output_iter;

            ++nb_second;

          }

          else {

            *unselected_iter = v;

            ++unselected_iter;

          }

        }

        // Incrémenter l'itérateur à la fin car il est utilisé pour le positionnement

        ++input_iter;

      }

      s.m_host_nb_list1_storage[0] = nb_first;

      s.m_host_nb_list1_storage[1] = nb_second;

    } break;

    default:

      ARCANE_FATAL(getBadPolicyMessage(exec_policy));

    }

    launch_info.endExecute();

  }


};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


} // namespace Arcane::Accelerator::impl


namespace Arcane::Accelerator

{


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/

/*!

 * \brief Algorithme générique de partitionnement d'une liste.

 *

 * Cette classe fournit des algorithmes pour partitionner une liste en deux

 * ou trois parties selon un critère fixé par l'utilisateur.

 */


class GenericPartitioner

: private impl::GenericPartitionerBase

{

 public:


  explicit GenericPartitioner(const RunQueue& queue)

  : impl::GenericPartitionerBase(queue)

  {

    _allocate();

  }


 public:


  /*!

   * \brief Effectue un partitionnement d'une liste en deux parties.

   *

   * Le nombre de valeurs de la liste est donné par \a nb_value.

   * Les deux fonctions lambda \a select_lambda et \a setter_lambda permettent

   * de partitionner et de positionner les valeurs de la liste.

   *

   * Après exécution, il est possible de récupérer le nombre d'éléments

   * de la première partie de la liste via la méthode \a nbFirstPart().

   *

   * \snippet AcceleratorPartitionerUnitTest.cc SampleListPartitionerTwoWayIndex

   */

  template <typename SelectLambda, typename SetterLambda>


  void applyWithIndex(Int32 nb_value, const SetterLambda& setter_lambda,

                      const SelectLambda& select_lambda, const TraceInfo& trace_info = TraceInfo())

  {

    if (_checkEmpty(nb_value))

      return;

    _setCalled();

    impl::GenericPartitionerBase* base_ptr = this;

    impl::GenericPartitionerIf gf;


    impl::IndexIterator input_iter;

    impl::SetterLambdaIterator<SetterLambda> out(setter_lambda);

    gf.apply(*base_ptr, nb_value, input_iter, out, select_lambda, trace_info);

  }


  /*!

   * \brief Effectue un partitionnement d'une liste en deux parties.

   *

   * Le nombre de valeurs de la liste est donné par \a nb_value.

   * Les valeurs en entrée sont fournies par l'itérateur \a input_iter et

   * les valeurs en sorties par l'itérateur \a output_iterator. La fonction

   * lambda \a select_lambda permet de sélectionner la partition utilisée :

   * si le retour est \a true, la valeur sera dans la première partie de la liste,

   * sinon elle sera dans la seconde. En sortie les valeurs de la deuxième

   * partie sont rangées en ordre inverse de la liste d'entrée.

   *

   * Après exécution, il est possible de récupérer le nombre d'éléments

   * de la première partie de la liste via la méthode \a nbFirstPart().

   *

   * \snippet AcceleratorPartitionerUnitTest.cc SampleListPartitionerTwoWayIf

   */

  template <typename InputIterator, typename OutputIterator, typename SelectLambda>


  void applyIf(Int32 nb_value, InputIterator input_iter, OutputIterator output_iter,

               const SelectLambda& select_lambda, const TraceInfo& trace_info = TraceInfo())

  {

    if (_checkEmpty(nb_value))

      return;

    _setCalled();

    impl::GenericPartitionerBase* base_ptr = this;

    impl::GenericPartitionerIf gf;

    gf.apply(*base_ptr, nb_value, input_iter, output_iter, select_lambda, trace_info);

  }


  /*!

   * \brief Effectue un partitionnement d'une liste en trois parties.

   *

   * Le nombre de valeurs de la liste est donné par \a nb_value.

   * Les deux fonctions lambda \a select1_lambda et \a select2_lambda permettent

   * de partitionner la liste avec l'algorithme suivant:

   * - si select1_lambda() est vrai, la valeur sera positionnée via \a setter1_lambda,

   * - sinon si select2_lambda() est vrai, la valeur sera positionnée via \a setter2_lambda,

   * - sinon la valeur sera positionnée via \a unselected_setter_lambda.

   *

   * Les listes en sortie sont dans le même ordre qu'en entrée.

   *

   * Après exécution, il est possible de récupérer le nombre d'éléments

   * de la première et de la deuxième liste la méthode \a nbParts().

   *

   * \snippet AcceleratorPartitionerUnitTest.cc SampleListPartitionerThreeWayIndex

   */

  template <typename Setter1Lambda, typename Setter2Lambda, typename UnselectedSetterLambda,

            typename Select1Lambda, typename Select2Lambda>


  void applyWithIndex(Int32 nb_value,

                      const Setter1Lambda setter1_lambda,

                      const Setter2Lambda setter2_lambda,

                      const UnselectedSetterLambda& unselected_setter_lambda,

                      const Select1Lambda& select1_lambda,

                      const Select2Lambda& select2_lambda,

                      const TraceInfo& trace_info = TraceInfo())

  {

    if (_checkEmpty(nb_value))

      return;

    _setCalled();

    impl::GenericPartitionerBase* base_ptr = this;

    impl::GenericPartitionerIf gf;

    impl::IndexIterator input_iter;

    impl::SetterLambdaIterator<Setter1Lambda> setter1_wrapper(setter1_lambda);

    impl::SetterLambdaIterator<Setter2Lambda> setter2_wrapper(setter2_lambda);

    impl::SetterLambdaIterator<UnselectedSetterLambda> unselected_setter_wrapper(unselected_setter_lambda);

    gf.apply3(*base_ptr, nb_value, input_iter, setter1_wrapper, setter2_wrapper,

              unselected_setter_wrapper, select1_lambda, select2_lambda, trace_info);

  }


  /*!

   * \brief Effectue un partitionnement d'une liste en trois parties.

   *

   * Le nombre de valeurs de la liste est donné par \a nb_value.

   * Les deux fonctions lambda \a select1_lambda et \a select2_lambda permettent

   * de partitionner la liste avec l'algorithme suivant:

   * - si select1_lambda() est vrai, la valeur ajoutée \a first_output_iter,

   * - sinon si select2_lambda() est vrai, la valeur sera ajoutée à \a second_output_iter,

   * - sinon la valeur sera ajoutée à \a unselected_iter.

   *

   * Les listes en sortie sont dans le même ordre qu'en entrée.

   *

   * Après exécution, il est possible de récupérer le nombre d'éléments

   * de la première et de la deuxième liste la méthode \a nbParts().

   *

   * \snippet AcceleratorPartitionerUnitTest.cc SampleListPartitionerThreeWayIf

   */

  template <typename InputIterator, typename FirstOutputIterator,

            typename SecondOutputIterator, typename UnselectedIterator,

            typename Select1Lambda, typename Select2Lambda>


  void applyIf(Int32 nb_value, InputIterator input_iter,

               FirstOutputIterator first_output_iter,

               SecondOutputIterator second_output_iter,

               UnselectedIterator unselected_iter,

               const Select1Lambda& select1_lambda,

               const Select2Lambda& select2_lambda,

               const TraceInfo& trace_info = TraceInfo())

  {

    if (_checkEmpty(nb_value))

      return;

    _setCalled();

    impl::GenericPartitionerBase* base_ptr = this;

    impl::GenericPartitionerIf gf;

    gf.apply3(*base_ptr, nb_value, input_iter, first_output_iter, second_output_iter,

              unselected_iter, select1_lambda, select2_lambda, trace_info);

  }


  /*!

   * \brief Nombre d'éléments de la première partie de la liste.

   */


  Int32 nbFirstPart()

  {

    m_is_already_called = false;

    return _nbFirstPart();

  }


  /*!

   * \brief Nombre d'éléments de la première et deuxième partie de la liste.

   *

   * Retourne une vue de deux valeurs. La première valeur contient le nombre

   * d'éléments de la première liste et la seconde valeur le

   * nombre d'éléments de la deuxième liste.

   *

   * Cette méthode n'est valide qu'après avoir appelé une méthode de partitionnement

   * en trois parties.

   */


  SmallSpan<const Int32> nbParts()

  {

    m_is_already_called = false;

    return _nbParts();

  }


 private:


  bool m_is_already_called = false;


 private:


  void _setCalled()

  {

    if (m_is_already_called)

      ARCANE_FATAL("apply() has already been called for this instance");

    m_is_already_called = true;

  }

  bool _checkEmpty(Int32 nb_value)

  {

    if (nb_value == 0) {

      _resetNbPart();

      return true;

    }

    return false;

  }

};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


} // namespace Arcane::Accelerator


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


#endif


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/

ARCANE_FATAL
#define ARCANE_FATAL(...)
Macro envoyant une exception FatalErrorException.
Definition ArcaneGlobal.h:768

RunCommandLoop.h
Types et macros pour gérer les boucles sur les accélérateurs.

RUNCOMMAND_LOOP1
#define RUNCOMMAND_LOOP1(iter_name, x1,...)
Boucle sur accélérateur avec arguments supplémentaires pour les réductions.
Definition RunCommandLoop.h:235

Arcane::Accelerator::GenericPartitioner::nbParts
SmallSpan< const Int32 > nbParts()
Nombre d'éléments de la première et deuxième partie de la liste.
Definition GenericPartitioner.h:496

Arcane::Accelerator::GenericPartitioner::nbFirstPart
Int32 nbFirstPart()
Nombre d'éléments de la première partie de la liste.
Definition GenericPartitioner.h:480

Arcane::Accelerator::GenericPartitioner::applyWithIndex
void applyWithIndex(Int32 nb_value, const Setter1Lambda setter1_lambda, const Setter2Lambda setter2_lambda, const UnselectedSetterLambda &unselected_setter_lambda, const Select1Lambda &select1_lambda, const Select2Lambda &select2_lambda, const TraceInfo &trace_info=TraceInfo())
Effectue un partitionnement d'une liste en trois parties.
Definition GenericPartitioner.h:419

Arcane::Accelerator::GenericPartitioner::applyIf
void applyIf(Int32 nb_value, InputIterator input_iter, OutputIterator output_iter, const SelectLambda &select_lambda, const TraceInfo &trace_info=TraceInfo())
Effectue un partitionnement d'une liste en deux parties.
Definition GenericPartitioner.h:389

Arcane::Accelerator::GenericPartitioner::applyWithIndex
void applyWithIndex(Int32 nb_value, const SetterLambda &setter_lambda, const SelectLambda &select_lambda, const TraceInfo &trace_info=TraceInfo())
Effectue un partitionnement d'une liste en deux parties.
Definition GenericPartitioner.h:358

Arcane::Accelerator::GenericPartitioner::applyIf
void applyIf(Int32 nb_value, InputIterator input_iter, FirstOutputIterator first_output_iter, SecondOutputIterator second_output_iter, UnselectedIterator unselected_iter, const Select1Lambda &select1_lambda, const Select2Lambda &select2_lambda, const TraceInfo &trace_info=TraceInfo())
Effectue un partitionnement d'une liste en trois parties.
Definition GenericPartitioner.h:460

Arcane::Accelerator::RunCommand
Gestion d'une commande sur accélérateur.
Definition core/RunCommand.h:46

Arcane::Accelerator::RunQueue
File d'exécution pour un accélérateur.
Definition core/RunQueue.h:52

Arcane::Accelerator::RunQueue::barrier
void barrier() const
Bloque tant que toutes les commandes associées à la file ne sont pas terminées.
Definition RunQueue.cc:159

Arcane::Accelerator::RunQueue::executionPolicy
eExecutionPolicy executionPolicy() const
Politique d'exécution de la file.
Definition RunQueue.cc:169

Arcane::Accelerator::impl::DeviceStorage
Definition CommonUtils.h:156

Arcane::Accelerator::impl::DeviceStorage::copyToAsync
void copyToAsync(SmallSpan< DataType > dest_ptr, const RunQueue &queue)
Copie l'instance dans dest_ptr.
Definition CommonUtils.h:169

Arcane::Accelerator::impl::GenericDeviceStorage
Definition CommonUtils.h:95

Arcane::Accelerator::impl::GenericPartitionerBase
Definition GenericPartitioner.h:44

Arcane::Accelerator::impl::GenericPartitionerIf
Definition GenericPartitioner.h:73

Arcane::Accelerator::impl::GenericPartitionerIf::apply3
void apply3(GenericPartitionerBase &s, Int32 nb_item, InputIterator input_iter, FirstOutputIterator first_output_iter, SecondOutputIterator second_output_iter, UnselectedIterator unselected_iter, const Select1Lambda &select1_lambda, const Select2Lambda &select2_lambda, const TraceInfo &trace_info=TraceInfo())
Effectue le partitionnement d'une liste en trois parties.
Definition GenericPartitioner.h:221

Arcane::Accelerator::impl::GenericPartitionerIf::apply
void apply(GenericPartitionerBase &s, Int32 nb_item, InputIterator input_iter, OutputIterator output_iter, const SelectLambda &select_lambda, const TraceInfo &trace_info=TraceInfo())
Effectue le partitionnement d'une liste en deux parties.
Definition GenericPartitioner.h:80

Arcane::Accelerator::impl::IndexIterator
Itérateur sur un index.
Definition CommonUtils.h:183

Arcane::Accelerator::impl::RunCommandLaunchInfo
Definition core/RunCommandLaunchInfo.h:36

Arcane::Accelerator::impl::RunCommandLaunchInfo::beginExecute
void beginExecute()
Indique qu'on commence l'exécution de la commande.
Definition RunCommandLaunchInfo.cc:63

Arcane::Accelerator::impl::RunCommandLaunchInfo::endExecute
void endExecute()
Signale la fin de l'exécution.
Definition RunCommandLaunchInfo.cc:82

Arcane::Accelerator::impl::SetterLambdaIterator
Itérateur sur une lambda pour positionner une valeur via un index.
Definition CommonUtils.h:386

Arcane::NumArray
Tableaux multi-dimensionnels pour les types numériques accessibles sur accélérateurs.
Definition utils/NumArray.h:58

Arcane::NumArray::to1DSmallSpan
constexpr SmallSpan< DataType > to1DSmallSpan()
Vue 1D sur l'instance (uniquement si rank == 1)
Definition utils/NumArray.h:679

Arcane::SmallSpan
Vue d'un tableau d'éléments de type T.
Definition Span.h:673

Arcane::TraceInfo
Informations de trace.
Definition arccore/src/base/arccore/base/TraceInfo.h:33

Arcane::Accelerator
Espace de nom pour l'utilisation des accélérateurs.
Definition ArcaneTypes.h:624

Arcane::Accelerator::makeCommand
RunCommand makeCommand(const RunQueue &run_queue)
Créé une commande associée à la file run_queue.
Definition core/RunQueue.h:283

Arcane::Accelerator::eExecutionPolicy
eExecutionPolicy
Politique d'exécution pour un Runner.
Definition AcceleratorCoreGlobal.h:93

Arcane::Accelerator::eExecutionPolicy::SYCL
@ SYCL
Politique d'exécution utilisant l'environnement SYCL.
Definition AcceleratorCoreGlobal.h:105

Arcane::Accelerator::eExecutionPolicy::HIP
@ HIP
Politique d'exécution utilisant l'environnement HIP.
Definition AcceleratorCoreGlobal.h:103

Arcane::Accelerator::eExecutionPolicy::CUDA
@ CUDA
Politique d'exécution utilisant l'environnement CUDA.
Definition AcceleratorCoreGlobal.h:101

Arcane::Accelerator::eExecutionPolicy::Sequential
@ Sequential
Politique d'exécution séquentielle.
Definition AcceleratorCoreGlobal.h:97

Arcane::Accelerator::eExecutionPolicy::Thread
@ Thread
Politique d'exécution multi-thread.
Definition AcceleratorCoreGlobal.h:99

Arcane::Int32
std::int32_t Int32
Type entier signé sur 32 bits.
Definition ArccoreGlobal.h:184