d9/d92/MultiThreadAlgo_8h_source.html

// -*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-

//-----------------------------------------------------------------------------

// Copyright 2000-2024 CEA (www.cea.fr) IFPEN (www.ifpenergiesnouvelles.com)

// See the top-level COPYRIGHT file for details.

// SPDX-License-Identifier: Apache-2.0

//-----------------------------------------------------------------------------

/*---------------------------------------------------------------------------*/

/* MultiThreadAlgo.h                                           (C) 2000-2024 */

/*                                                                           */

/* Implémentation des algorithmes accélérateurs en mode multi-thread.        */

/*---------------------------------------------------------------------------*/

#ifndef ARCANE_ACCELERATOR_MULTITHREADALGO_H

#define ARCANE_ACCELERATOR_MULTITHREADALGO_H

/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


#include "arcane/utils/SmallArray.h"


#include "arcane/core/Concurrency.h"


#include "arcane/accelerator/AcceleratorGlobal.h"


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


namespace Arcane::Accelerator::impl

{


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


class MultiThreadAlgo

{

 public:


  template <bool IsExclusive, typename DataType, typename Operator,

            typename InputIterator, typename OutputIterator>


  void doScan(ForLoopRunInfo run_info, Int32 nb_value,

              InputIterator input, OutputIterator output,

              DataType init_value, Operator op)

  {

    //std::cout << "DO_SCAN MULTI_THREAD nb_value=" << nb_value << " init_value=" << init_value << "\n";

    auto multiple_getter_func = [=](Int32 input_index, Int32 nb_value) -> DataType {

      DataType partial_value = Operator::defaultValue();

      for (Int32 x = 0; x < nb_value; ++x)

        partial_value = op(input[x + input_index], partial_value);

      return partial_value;

    };


    auto multiple_setter_func = [=](DataType previous_sum, Int32 input_index, Int32 nb_value) {

      for (Int32 x = 0; x < nb_value; ++x) {

        if constexpr (IsExclusive) {

          output[x + input_index] = previous_sum;

          previous_sum = op(input[x + input_index], previous_sum);

        }

        else {

          previous_sum = op(input[x + input_index], previous_sum);

          output[x + input_index] = previous_sum;

        }

      }

    };

    // TODO: calculer automatiquement cette valeur.

    const Int32 nb_block = 10;


    // Tableau pour conserver les valeurs partielles des blocs.

    // TODO: Utiliser un padding pour éviter des conflits de cache entre les threads.

    SmallArray<DataType> partial_values(nb_block);

    Span<DataType> out_partial_values = partial_values;


    auto partial_value_func = [=](Int32 a, Int32 n) {

      for (Int32 i = 0; i < n; ++i) {

        Int32 interval_index = i + a;


        Int32 input_index = 0;

        Int32 nb_value_in_interval = 0;

        _subInterval<Int32>(nb_value, interval_index, nb_block, &input_index, &nb_value_in_interval);


        DataType partial_value = multiple_getter_func(input_index, nb_value_in_interval);


        out_partial_values[interval_index] = partial_value;

      }

    };


    ParallelLoopOptions loop_options(run_info.options().value_or(ParallelLoopOptions{}));

    loop_options.setGrainSize(1);

    run_info.addOptions(loop_options);


    // Calcule les sommes partielles pour nb_block

    Arcane::arcaneParallelFor(0, nb_block, run_info, partial_value_func);


    auto final_sum_func = [=](Int32 a, Int32 n) {

      for (Int32 i = 0; i < n; ++i) {

        Int32 interval_index = i + a;


        DataType previous_sum = init_value;

        for (Int32 z = 0; z < interval_index; ++z)

          previous_sum = op(out_partial_values[z], previous_sum);


        Int32 input_index = 0;

        Int32 nb_value_in_interval = 0;

        _subInterval<Int32>(nb_value, interval_index, nb_block, &input_index, &nb_value_in_interval);


        multiple_setter_func(previous_sum, input_index, nb_value_in_interval);

      }

    };


    // Calcule les valeurs finales

    Arcane::arcaneParallelFor(0, nb_block, run_info, final_sum_func);

  }


  template <bool InPlace, typename InputIterator, typename OutputIterator, typename SelectLambda>

  Int32 doFilter(ForLoopRunInfo run_info, Int32 nb_value,

                 InputIterator input, OutputIterator output,

                 SelectLambda select_lambda)

  {

    // Type de l'index

    using IndexType = Int32;


    UniqueArray<bool> select_flags(nb_value);

    Span<bool> select_flags_view = select_flags;

    //std::cout << "DO_FILTER MULTI_THREAD nb_value=" << nb_value << "\n";

    auto multiple_getter_func = [=](Int32 input_index, Int32 nb_value) -> IndexType {

      IndexType partial_value = 0;

      for (Int32 x = 0; x < nb_value; ++x) {

        const Int32 index = x + input_index;

        bool is_select = select_lambda(input[index]);

        select_flags_view[index] = is_select;

        if (is_select)

          ++partial_value;

      }

      return partial_value;

    };


    auto multiple_setter_func = [=](IndexType partial_value, Int32 input_index, Int32 nb_value) {

      for (Int32 x = 0; x < nb_value; ++x) {

        const Int32 index = x + input_index;

        if (select_flags_view[index]) {

          output[partial_value] = input[index];

          ++partial_value;

        }

      }

    };


    // TODO: calculer automatiquement cette valeur.

    const Int32 nb_block = 10;


    // Tableau pour conserver les valeurs partielles des blocs.

    // TODO: Utiliser un padding pour éviter des conflits de cache entre les threads.

    SmallArray<Int32> partial_values(nb_block, 0);

    Span<Int32> out_partial_values = partial_values;


    auto partial_value_func = [=](Int32 a, Int32 n) {

      for (Int32 i = 0; i < n; ++i) {

        Int32 interval_index = i + a;


        Int32 input_index = 0;

        Int32 nb_value_in_interval = 0;

        _subInterval<Int32>(nb_value, interval_index, nb_block, &input_index, &nb_value_in_interval);


        out_partial_values[interval_index] = multiple_getter_func(input_index, nb_value_in_interval);

      }

    };


    ParallelLoopOptions loop_options(run_info.options().value_or(ParallelLoopOptions{}));

    loop_options.setGrainSize(1);

    run_info.addOptions(loop_options);


    // Calcule les sommes partielles pour nb_block

    Arcane::arcaneParallelFor(0, nb_block, run_info, partial_value_func);


    // Calcule le nombre de valeurs filtrées

    // Calcule aussi la valeur accumulée de partial_values

    Int32 nb_filter = 0;

    for (Int32 i = 0; i < nb_block; ++i) {

      Int32 x = partial_values[i];

      nb_filter += x;

      partial_values[i] = nb_filter;

    }


    auto filter_func = [=](Int32 a, Int32 n) {

      for (Int32 i = 0; i < n; ++i) {

        Int32 interval_index = i + a;


        IndexType partial_value = 0;

        if (interval_index > 0)

          partial_value = out_partial_values[interval_index - 1];


        Int32 input_index = 0;

        Int32 nb_value_in_interval = 0;

        _subInterval<Int32>(nb_value, interval_index, nb_block, &input_index, &nb_value_in_interval);


        multiple_setter_func(partial_value, input_index, nb_value_in_interval);

      }

    };


    // Si l'entrée et la sortie sont les mêmes, on fait le remplissage en séquentiel.

    // TODO: faire en parallèle.

    if (InPlace)

      filter_func(0, nb_block);

    else

      Arcane::arcaneParallelFor(0, nb_block, run_info, filter_func);


    return nb_filter;

  }


 private:


  template <typename SizeType>

  static void _subInterval(SizeType size, SizeType interval_index, SizeType nb_interval,

                           SizeType* out_begin_index, SizeType* out_interval_size)

  {

    *out_begin_index = 0;

    *out_interval_size = 0;

    if (nb_interval <= 0)

      return;

    if (interval_index < 0 || interval_index >= nb_interval)

      return;

    SizeType isize = size / nb_interval;

    SizeType ibegin = interval_index * isize;

    // Pour le dernier interval, prend les elements restants

    if ((interval_index + 1) == nb_interval)

      isize = size - ibegin;

    *out_begin_index = ibegin;

    *out_interval_size = isize;

  }

};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


} // namespace Arcane::Accelerator::impl


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


#endif


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/

Concurrency.h
Classes, Types et macros pour gérer la concurrence.

Arcane::Accelerator::impl::MultiThreadAlgo
Algorithmes avancée en mode multi-thread.
Definition MultiThreadAlgo.h:37

Arcane::Accelerator::impl::MultiThreadAlgo::doScan
void doScan(ForLoopRunInfo run_info, Int32 nb_value, InputIterator input, OutputIterator output, DataType init_value, Operator op)
Algorithme de scan multi-thread.
Definition MultiThreadAlgo.h:60

Arcane::ForLoopRunInfo
Informations d'exécution d'une boucle.
Definition ConcurrencyUtils.h:56

Arcane::ParallelLoopOptions
Options d'exécution d'une boucle parallèle en multi-thread.
Definition ParallelLoopOptions.h:35

Arcane::ParallelLoopOptions::setGrainSize
void setGrainSize(Integer v)
Positionne la taille (approximative) d'un intervalle d'itération.
Definition ParallelLoopOptions.h:108

Arcane::SmallArray
Tableau 1D de données avec buffer pré-alloué sur la pile.
Definition SmallArray.h:89

Arcane::Span
Vue d'un tableau d'éléments de type T.
Definition Span.h:513

Arcane::UniqueArray
Vecteur 1D de données avec sémantique par valeur (style STL).
Definition arccore/src/collections/arccore/collections/Array.h:1844

Arcane::arcaneParallelFor
void arcaneParallelFor(Integer i0, Integer size, InstanceType *itype, void(InstanceType::*lambda_function)(Integer i0, Integer size))
Applique en concurrence la fonction lambda lambda_function sur l'intervalle d'itération [i0,...
Definition Concurrency.h:199

Arcane::Int32
std::int32_t Int32
Type entier signé sur 32 bits.
Definition ArccoreGlobal.h:184

SizeType
RAPIDJSON_NAMESPACE_BEGIN typedef unsigned SizeType
Size type (for string lengths, array sizes, etc.)
Definition rapidjson.h:385