d2/d36/BitonicSortT_8H_source.html

// -*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-

//-----------------------------------------------------------------------------

// Copyright 2000-2025 CEA (www.cea.fr) IFPEN (www.ifpenergiesnouvelles.com)

// See the top-level COPYRIGHT file for details.

// SPDX-License-Identifier: Apache-2.0

//-----------------------------------------------------------------------------

/*---------------------------------------------------------------------------*/

/* BitonicSortT.H                                              (C) 2000-2025 */

/*                                                                           */

/* Algorithme de tri bi-tonique parallèle.                                   */

/*---------------------------------------------------------------------------*/

#ifndef ARCANE_CORE_PARALLEL_BITONICSORT_IMPL_H

#define ARCANE_CORE_PARALLEL_BITONICSORT_IMPL_H

/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


#include "arcane/utils/TraceAccessor.h"

#include "arcane/utils/FatalErrorException.h"


#include "arcane/core/IParallelMng.h"

#include "arcane/core/parallel/BitonicSort.h"


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


namespace Arcane::Parallel

{


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


template <typename KeyType, typename KeyTypeTraits> BitonicSort<KeyType, KeyTypeTraits>::

BitonicSort(IParallelMng* parallel_mng)

: TraceAccessor(parallel_mng->traceMng())

, m_parallel_mng(parallel_mng)

{

}


template <typename KeyType, typename KeyTypeTraits> BitonicSort<KeyType, KeyTypeTraits>::

BitonicSort(IParallelMng* parallel_mng, const KeyTypeTraits& traits)

: TraceAccessor(parallel_mng->traceMng())

, m_parallel_mng(parallel_mng)

, m_traits(traits)

{

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


template <typename KeyType, typename KeyTypeTraits> void BitonicSort<KeyType, KeyTypeTraits>::

_init(ConstArrayView<KeyType> keys)

{

  m_init_size = keys.size();


  // Il est indispensable que tous les rangs aient la même valeur

  // de m_size

  m_size = m_parallel_mng->reduce(Parallel::ReduceMax, m_init_size);


  m_keys.resize(m_size);

  m_key_ranks.resize(m_size);

  m_key_indexes.resize(m_size);


  Int32 rank = m_parallel_mng->commRank();


  // Les valeurs de la variable aux mailles tab sont stockées

  // dans le tableau m_key

  for (Integer i = 0; i < m_init_size; ++i) {

    m_keys[i] = keys[i];

    m_key_indexes[i] = i;

    m_key_ranks[i] = rank;

  }


  // Remplit la fin du tableau avec des valeurs non significatives

  // Afin que chaque processeur ait le meme nombre d'elements

  KeyType max_value = m_traits.maxValue();

  for (Int64 i = m_init_size; i < m_size; i++) {

    m_keys[i] = max_value;

    m_key_indexes[i] = -1;

    m_key_ranks[i] = rank;

  }

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/

template <typename KeyType, typename KeyTypeTraits> void


BitonicSort<KeyType, KeyTypeTraits>::

sort(ConstArrayView<KeyType> keys)

{

  _init(keys);


  m_nb_merge = 0;


  info() << "BITONIC_SORT (64bit) want_rank?=" << m_want_index_and_rank

         << " size=" << m_size

         << " memsize=" << sizeof(KeyType) * m_size

         << " structsize=" << sizeof(KeyType);


  // Appel au tri local des cles

  _localHeapSort();


  // Définition du nombre de niveaux pour l'algorithme

  Int32 nb_level = 0;

  Int32 test = 1;

  Int32 nb_rank = m_parallel_mng->commSize();

  while (nb_rank > test) {

    nb_level++;

    test *= 2;

  }

  Int32 size = 1;


  // Boucle sur les niveaux de profondeurs de l'algorithme

  for (Int32 ilevel = 0; ilevel < nb_level; ++ilevel) {

    size *= 2;


    // Boucle sur les groupes de processeurs à traiter

    for (Int32 jproc = 0; jproc < nb_rank; jproc += size) {

      _mergeLevels(jproc, size);

    }

  }


  // Le nombre d'éléments valides de la liste peut-être inférieur

  // au nombre d'éléments alloués. Dès qu'une valeur est invalide,

  // on arrête la liste.

  // TODO: partir de la fin

  for (Integer i = 0; i < m_size; ++i) {

    if (!m_traits.isValid(m_keys[i])) {

      m_size = i;

      break;

    }

  }


  info() << "END_BITONIC_SORT nb_merge=" << m_nb_merge;


  m_keys.resize(m_size);

  m_key_ranks.resize(m_size);

  m_key_indexes.resize(m_size);

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/

template <typename KeyType, typename KeyTypeTraits> void


BitonicSort<KeyType, KeyTypeTraits>::

_mergeLevels(Int32 begin, Int32 size)

{

  //etage separateur

  for (Int32 i = 0; i < size / 2; ++i)

    _mergeProcessors(begin + i, begin + size - 1 - i);


  if (size <= 2)

    return;


  // Application de la trieuse bitonique de niveau n/2

  Int32 div_size = size;

  while (div_size > 1) {

    div_size /= 2;

    for (Int32 iproc = 0; iproc < size; iproc += div_size)

      _separator(begin + iproc, div_size);

  }

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


template <typename KeyType, typename KeyTypeTraits> void BitonicSort<KeyType, KeyTypeTraits>::

_separator(Int32 begin, Int32 size)

{

  for (Int32 i = 0; i < size / 2; ++i)

    _mergeProcessors(begin + i, begin + i + size / 2);

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


template <typename KeyType, typename KeyTypeTraits> void BitonicSort<KeyType, KeyTypeTraits>::

_mergeProcessors(Int32 iproc1, Int32 iproc2)

{

  if (iproc1 >= iproc2)

    ARCANE_FATAL("Invalid merge iproc1={0} iproc2={1}", iproc1, iproc2);


  Int32 my_rank = m_parallel_mng->commRank();


  if (iproc2 >= m_parallel_mng->commSize())

    return;


  bool is_proc2 = (iproc2 == my_rank);

  bool is_proc1 = (iproc1 == my_rank);


  if (!is_proc1 && !is_proc2)

    return;


  info() << "SORT iproc1=" << iproc1 << " iproc2=" << iproc2;

  ++m_nb_merge;


  const Int64 buf_size = m_size;

  const bool is_want_index_rank = m_want_index_and_rank;

  //traitement du processeur 2


  if (is_proc2) {

    //envoi de la liste au proc 1

    UniqueArray<KeyType> send_keys(m_keys);

    UniqueArray<Request> requests;

    requests.add(m_traits.send(m_parallel_mng, iproc1, send_keys));

    if (is_want_index_rank) {

      requests.add(m_parallel_mng->send(m_key_indexes, iproc1, false));

      requests.add(m_parallel_mng->send(m_key_ranks, iproc1, false));

    }

    //reception de la fin de la liste fusionnee par le proc1

    requests.add(m_traits.recv(m_parallel_mng, iproc1, m_keys));

    if (is_want_index_rank) {

      requests.add(m_parallel_mng->recv(m_key_indexes, iproc1, false));

      requests.add(m_parallel_mng->recv(m_key_ranks, iproc1, false));

    }

    m_parallel_mng->waitAllRequests(requests);

  }


  //traitement du processeur 1

  if (is_proc1) {

    //reception de la liste du proc2


    UniqueArray<KeyType> buf2(buf_size);

    Int32UniqueArray buf2_proc;

    Int32UniqueArray buf2_local_id;

    //on alloue buf2 a la taille+1 afin de placer une sentinelle en

    //buf2[size]

    buf2.resize(buf_size);

    if (is_want_index_rank) {

      buf2_proc.resize(buf_size);

      buf2_local_id.resize(buf_size);

    }


    Request recv_request = m_traits.recv(m_parallel_mng, iproc2, buf2);

    m_parallel_mng->waitAllRequests(ArrayView<Request>(1, &recv_request));

    if (is_want_index_rank) {

      m_parallel_mng->recv(buf2_local_id, iproc2);

      m_parallel_mng->recv(buf2_proc, iproc2);

    }


    //à remplacer par le plus grand nombre representable par un Integer

    buf2.add(m_traits.maxValue());


    // allocation d'un buffer de travail pour la fusion des deux listes

    Int64 total_size = m_size + buf_size;

    UniqueArray<KeyType> buf_merge(total_size);

    UniqueArray<Int32> buf_proc_merge;

    UniqueArray<Int32> buf_local_id_merge;

    if (is_want_index_rank) {

      buf_proc_merge.resize(total_size);

      buf_local_id_merge.resize(total_size);

    }


#if 0

    info() << "SIZE=" << buf_size << " total=" << total_size << " m_size=" << m_size

           << " proc2=" << iproc2 << " init-size=" << m_init_size;

#endif


    // Fusion des deux listes en partant du principe que chacune est

    // déjà triée.

    Int64 cursor1 = 0;

    Int64 cursor2 = 0;

    for (Int64 i = 0; i < total_size; ++i) {

      if (cursor1 >= m_size || (m_traits.compareLess(buf2[cursor2], m_keys[cursor1]) && cursor2 < buf_size)) {

        buf_merge[i] = buf2[cursor2];

        if (is_want_index_rank) {

          buf_local_id_merge[i] = buf2_local_id[cursor2];

          buf_proc_merge[i] = buf2_proc[cursor2];

        }

        ++cursor2;

      }

      else {

        buf_merge[i] = m_keys[cursor1];

        if (is_want_index_rank) {

          buf_local_id_merge[i] = m_key_indexes[cursor1];

          buf_proc_merge[i] = m_key_ranks[cursor1];

        }

        ++cursor1;

      }

    }

    buf2.resize(buf_size);


    // Recopie et envoi de la fin de la liste vers le proc2

    for (Integer ii = 0; ii < buf_size; ii++) {

      buf2[ii] = buf_merge[m_size + ii];

      if (is_want_index_rank) {

        buf2_local_id[ii] = buf_local_id_merge[m_size + ii];

        buf2_proc[ii] = buf_proc_merge[m_size + ii];

      }

    }

    Request send_request = m_traits.send(m_parallel_mng, iproc2, buf2);

    m_parallel_mng->waitAllRequests(ArrayView<Request>(1, &send_request));

    if (is_want_index_rank) {

      m_parallel_mng->send(buf2_local_id, iproc2);

      m_parallel_mng->send(buf2_proc, iproc2);

    }


    // recopie du debut de la liste dans la variable m_work_unique_id

    for (Integer i = 0; i < buf_size; i++) {

      m_keys[i] = buf_merge[i];

      if (is_want_index_rank) {

        m_key_indexes[i] = buf_local_id_merge[i];

        m_key_ranks[i] = buf_proc_merge[i];

      }

    }

  }

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/

template <typename KeyType, typename KeyTypeTraits>


void BitonicSort<KeyType, KeyTypeTraits>::

_localHeapSort()

{

  // Cas particulier d'une liste réduite à zero ou un element

  if (m_size < 2)

    return;


  // Suivant du parent du dernier element

  Int64 l = m_size / 2;

  Int64 ir = m_size - 1;

  KeyType rra;

  Int64 i = 0;

  Int64 j = 0;

  Integer tmp_local_id = NULL_ITEM_LOCAL_ID;

  Integer tmp_proc = A_NULL_RANK;


  for (;;) {

    if (l > 0) {

      --l;

      rra = m_keys[l];

      tmp_local_id = m_key_indexes[l];

      tmp_proc = m_key_ranks[l];

    }

    else {

      rra = m_keys[ir];

      tmp_local_id = m_key_indexes[ir];

      tmp_proc = m_key_ranks[ir];


      m_keys[ir] = m_keys[0];

      m_key_indexes[ir] = m_key_indexes[0];

      m_key_ranks[ir] = m_key_ranks[0];


      if (--ir == 0) {

        m_keys[0] = rra;

        m_key_indexes[0] = tmp_local_id;

        m_key_ranks[0] = tmp_proc;

        break;

      }

    }

    i = l;

    j = l + l + 1;

    while (j <= ir) {

      if (j < ir && m_traits.compareLess(m_keys[j], m_keys[j + 1]))

        ++j;

      if (m_traits.compareLess(rra, m_keys[j])) {

        m_keys[i] = m_keys[j];

        m_key_indexes[i] = m_key_indexes[j];

        m_key_ranks[i] = m_key_ranks[j];

        i = j;

        //enfant a gauche

        j = j * 2 + 1;

      }

      else

        j = ir + 1;

    }

    m_keys[i] = rra;

    m_key_indexes[i] = tmp_local_id;

    m_key_ranks[i] = tmp_proc;

  }

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


} // namespace Arcane::Parallel


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


#endif

ARCANE_FATAL
#define ARCANE_FATAL(...)
Macro envoyant une exception FatalErrorException.
Definition ArcaneGlobal.h:740

Arcane::ArrayView
Vue modifiable d'un tableau d'un type T.
Definition arccore/src/base/arccore/base/ArrayView.h:94

Arcane::Array::resize
void resize(Int64 s)
Change le nombre d'éléments du tableau à s.
Definition arccore/src/common/arccore/common/Array.h:249

Arcane::Array::add
void add(ConstReferenceType val)
Ajoute l'élément val à la fin du tableau.
Definition arccore/src/common/arccore/common/Array.h:206

Arcane::ConstArrayView
Vue constante d'un tableau de type T.
Definition arccore/src/base/arccore/base/ArrayView.h:533

Arcane::IParallelMng
Interface du gestionnaire de parallélisme pour un sous-domaine.
Definition IParallelMng.h:52

Arcane::MessagePassing::Request
Requête d'un message.
Definition Request.h:77

Arcane::Parallel::BitonicSort
Algorithme de tri bi-tonique parallèle.
Definition BitonicSort.h:102

Arcane::Parallel::BitonicSort::_mergeProcessors
void _mergeProcessors(Int32 proc1, Int32 proc2)
Fusion des listes de deux processeurs.
Definition BitonicSortT.H:211

Arcane::Parallel::BitonicSort::m_nb_merge
Integer m_nb_merge
Statistiques sur le nombre de niveaux de messages.
Definition BitonicSort.h:159

Arcane::Parallel::BitonicSort::keys
ConstArrayView< KeyType > keys() const override
Après un tri, retourne la liste des éléments de ce rang.
Definition BitonicSort.h:118

Arcane::Parallel::BitonicSort::_separator
void _separator(Int32 begin, Int32 size)
Etage séparateur de l'algorithme de tri bi-tonique.
Definition BitonicSortT.H:188

Arcane::Parallel::BitonicSort::m_want_index_and_rank
bool m_want_index_and_rank
Indique si on souhaite les infos sur les rangs et index.
Definition BitonicSort.h:156

Arcane::Parallel::BitonicSort::m_size
Int64 m_size
Nombre d'éléments locaux pour le tri bi-tonique.
Definition BitonicSort.h:153

Arcane::Parallel::BitonicSort::m_key_ranks
UniqueArray< Int32 > m_key_ranks
Tableau contenant le rang du processeur où se trouve la clé
Definition BitonicSort.h:145

Arcane::Parallel::BitonicSort::m_key_indexes
UniqueArray< Int32 > m_key_indexes
Tableau contenant l'indice de la clé dans le processeur.
Definition BitonicSort.h:147

Arcane::Parallel::BitonicSort::m_init_size
Int64 m_init_size
Nombre d'éléments locaux.
Definition BitonicSort.h:151

Arcane::Parallel::BitonicSort::m_keys
UniqueArray< KeyType > m_keys
Variable contenant la cle du tri.
Definition BitonicSort.h:143

Arcane::Parallel::BitonicSort::m_parallel_mng
IParallelMng * m_parallel_mng
Gestionnaire du parallèlisme.
Definition BitonicSort.h:149

Arcane::Parallel::BitonicSort::_localHeapSort
void _localHeapSort()
Tri par tas en local de la variable m_key.
Definition BitonicSortT.H:356

Arcane::Parallel::BitonicSort::_mergeLevels
void _mergeLevels(Int32 begin, Int32 size)
Tri bi-tonique de la variable key.
Definition BitonicSortT.H:164

Arcane::TraceAccessor
Classe d'accès aux traces.
Definition arccore/src/trace/arccore/trace/TraceAccessor.h:39

Arcane::TraceAccessor::info
TraceMessage info() const
Flot pour un message d'information.
Definition TraceAccessor.cc:101

Arcane::UniqueArray
Vecteur 1D de données avec sémantique par valeur (style STL).
Definition arccore/src/common/arccore/common/Array.h:888

Arcane::Parallel
Implémentation de la concurrence.
Definition Concurrency.h:279

Arcane::Int64
std::int64_t Int64
Type entier signé sur 64 bits.
Definition ArccoreGlobal.h:227

Arcane::Integer
Int32 Integer
Type représentant un entier.
Definition ArccoreGlobal.h:281

Arcane::Int32UniqueArray
UniqueArray< Int32 > Int32UniqueArray
Tableau dynamique à une dimension d'entiers 32 bits.
Definition UtilsTypes.h:341

Arcane::Int32
std::int32_t Int32
Type entier signé sur 32 bits.
Definition ArccoreGlobal.h:225