14#include "arccore/base/ReferenceCounter.h"
16#include "arccore/message_passing/PointToPointMessageInfo.h"
18#include "arcane/utils/Collection.h"
19#include "arcane/utils/ITraceMng.h"
20#include "arcane/utils/NotImplementedException.h"
21#include "arcane/utils/Real2.h"
22#include "arcane/utils/Real2x2.h"
23#include "arcane/utils/Real3.h"
24#include "arcane/utils/Real3x3.h"
25#include "arcane/utils/HPReal.h"
26#include "arcane/utils/NullThreadMng.h"
27#include "arcane/utils/ArgumentException.h"
29#include "arcane/core/IIOMng.h"
30#include "arcane/core/ISubDomain.h"
31#include "arcane/core/IApplication.h"
32#include "arcane/core/IParallelDispatch.h"
33#include "arcane/core/ParallelMngDispatcher.h"
34#include "arcane/core/ItemGroup.h"
35#include "arcane/core/IMesh.h"
36#include "arcane/core/IItemFamily.h"
37#include "arcane/core/MeshVariable.h"
38#include "arcane/core/Timer.h"
39#include "arcane/core/FactoryService.h"
40#include "arcane/core/AbstractService.h"
41#include "arcane/core/ISerializer.h"
42#include "arcane/core/internal/SerializeMessage.h"
43#include "arcane/core/internal/ParallelMngInternal.h"
45#include "arcane/parallel/IStat.h"
47#include "arcane/impl/TimerMng.h"
48#include "arcane/impl/GetVariablesValuesParallelOperation.h"
49#include "arcane/impl/ParallelExchanger.h"
50#include "arcane/impl/ParallelTopology.h"
51#include "arcane/impl/ParallelReplication.h"
52#include "arcane/impl/SequentialParallelSuperMng.h"
53#include "arcane/impl/SequentialParallelMng.h"
54#include "arcane/impl/internal/ParallelMngUtilsFactoryBase.h"
55#include "arcane/impl/internal/VariableSynchronizer.h"
57#include "arccore/message_passing/RequestListBase.h"
58#include "arccore/message_passing/SerializeMessageList.h"
59#include "arccore/message_passing/internal/IMachineMemoryWindowBaseInternal.h"
80:
public RequestListBase
85 ARCANE_UNUSED(wait_mode);
95class SequentialParallelDispatchT
104 SequentialParallelDispatchT(
ITraceMng* tm)
106 void finalize()
override {}
110 ARCANE_UNUSED(send_buf);
115 ARCANE_UNUSED(send_buf);
120 recv_buf.
copy(send_buf);
124 recv_buf.
copy(send_buf);
129 recv_buf.
copy(send_buf);
134 recv_buf.
copy(send_buf);
139 recv_buf.
copy(send_buf);
144 recv_buf.
copy(send_buf);
148 gatherVariable(send_buf,recv_buf,0);
152 gatherVariable(send_buf,recv_buf,0);
157 recv_buf.resize(send_buf.
size());
164 recv_buf.resize(send_buf.
size());
170 ARCANE_UNUSED(count);
171 recv_buf.
copy(send_buf);
175 ARCANE_UNUSED(count);
176 recv_buf.
copy(send_buf);
185 ARCANE_UNUSED(send_count);
186 ARCANE_UNUSED(recv_count);
187 ARCANE_UNUSED(send_index);
188 ARCANE_UNUSED(recv_index);
189 recv_buf.
copy(send_buf);
198 ARCANE_UNUSED(send_count);
199 ARCANE_UNUSED(recv_count);
200 ARCANE_UNUSED(send_index);
201 ARCANE_UNUSED(recv_index);
202 recv_buf.
copy(send_buf);
210 ARCANE_UNUSED(send_buffer);
216 Request send(
Span<const Type> send_buffer,
const PointToPointMessageInfo& message)
override
218 ARCANE_UNUSED(send_buffer);
225 return receive(
Span<Type>(recv_buffer),rank,is_blocked);
229 ARCANE_UNUSED(send_buffer);
235 ARCANE_UNUSED(recv_buffer);
239 Request receive(
Span<Type> recv_buffer,
Int32 rank,
bool is_blocked)
override
241 ARCANE_UNUSED(recv_buffer);
247 Request receive(
Span<Type> recv_buffer,
const PointToPointMessageInfo& message)
override
249 ARCANE_UNUSED(recv_buffer);
257 recv_buffer.
copy(send_buffer);
259 Type allReduce(eReduceType op,
Type v)
override
267 ARCANE_UNUSED(send_buf);
269 void allReduce(eReduceType op,
Span<Type> send_buf)
override
272 ARCANE_UNUSED(send_buf);
277 ARCANE_UNUSED(send_buf);
278 ARCANE_UNUSED(recv_buf);
283 recv_buf.
copy(send_buf);
288 ARCANE_UNUSED(send_buf);
295 recv_buf.
copy(send_buf);
300 ARCANE_UNUSED(count);
301 recv_buf.
copy(send_buf);
308 ARCANE_UNUSED(send_count);
309 ARCANE_UNUSED(recv_count);
310 ARCANE_UNUSED(send_index);
311 ARCANE_UNUSED(recv_index);
312 recv_buf.
copy(send_buf);
315 Type scan(eReduceType op,
Type v)
override
323 ARCANE_UNUSED(send_buf);
327 Int32& max_rank)
override
329 min_val = max_val = sum_val = val;
330 min_rank = max_rank = 0;
341 min_values[i] = max_values[i] = sum_values[i] = values[i];
342 min_ranks[i] = max_ranks[i] = 0;
351class SequentialMachineMemoryWindowBaseInternal
356 SequentialMachineMemoryWindowBaseInternal(
Int64 sizeof_segment,
Int32 sizeof_type)
357 : m_sizeof_segment(sizeof_segment)
358 , m_max_sizeof_segment(sizeof_segment)
359 , m_sizeof_type(sizeof_type)
361 m_segment =
new std::byte[m_sizeof_segment];
364 ~SequentialMachineMemoryWindowBaseInternal()
override
373 return m_sizeof_type;
383 ARCANE_FATAL(
"Rank {0} is unavailable (Sequential)", rank);
394 if (new_sizeof_segment > m_max_sizeof_segment) {
395 ARCANE_FATAL(
"New size of window (sum of size of all segments) is superior than the old size");
397 m_sizeof_segment = new_sizeof_segment;
409 Int64 m_sizeof_segment;
410 Int64 m_max_sizeof_segment;
413 std::byte* m_segment;
434 return makeRef(createNullVariableSynchronizer(pm,group));
446class SequentialParallelMng
447:
public ParallelMngDispatcher
457 ~SequentialParallelMng();
466 void setBaseObject(
IBase* m);
481 recv_serializer->
copy(send_serializer);
485 ARCANE_UNUSED(values);
490 ARCANE_UNUSED(values);
492 ARCANE_UNUSED(bytes);
502 ARCANE_UNUSED(values);
511 void broadcastString(
String& str,
Int32 rank)
override
518 ARCANE_UNUSED(bytes);
523 ARCANE_UNUSED(values);
528 ARCANE_UNUSED(message);
533 ARCANE_UNUSED(message);
538 ARCANE_UNUSED(values);
539 ARCANE_UNUSED(message);
544 ARCANE_UNUSED(values);
545 ARCANE_UNUSED(message);
551 ARCANE_UNUSED(messages);
555 ARCANE_UNUSED(requests);
566 ARCANE_UNUSED(requests);
572 ARCANE_UNUSED(requests);
605 return createNullVariableSynchronizer(
this,family->
allItems());
609 return createNullVariableSynchronizer(
this,group);
620 return m_replication;
625 delete m_replication;
637 return m_utils_factory;
645 void build()
override;
672 ARCANE_UNUSED(kept_ranks);
673 SequentialParallelMngBuildInfo bi(m_timer_mng,m_world_parallel_mng);
674 bi.setThreadMng(m_thread_mng);
675 bi.setTraceMng(m_trace.get());
676 bi.setCommunicator(m_communicator);
682 ReferenceCounter<ITraceMng> m_trace;
683 IThreadMng* m_thread_mng =
nullptr;
684 ITimerMng* m_timer_mng =
nullptr;
685 IParallelMng* m_world_parallel_mng =
nullptr;
687 Parallel::IStat* m_stat;
688 IParallelReplication* m_replication;
689 MP::Communicator m_communicator;
690 Ref<IParallelMngUtilsFactory> m_utils_factory;
691 IParallelMngInternal* m_parallel_mng_internal =
nullptr;
706 return SequentialParallelMng::create(bi);
711 return SequentialParallelMng::createRef(bi);
718:
public ParallelMngInternal
722 explicit Impl(SequentialParallelMng* pm)
723 : ParallelMngInternal(pm)
726 ~Impl()
override =
default;
739SequentialParallelMng::
742, m_trace(bi.traceMng())
743, m_thread_mng(bi.threadMng())
744, m_timer_mng(bi.m_timer_mng)
745, m_world_parallel_mng(bi.m_world_parallel_mng)
749, m_communicator(bi.communicator())
751, m_parallel_mng_internal(new Impl(this))
753 ARCANE_CHECK_PTR(m_trace);
754 ARCANE_CHECK_PTR(m_thread_mng);
755 if (!m_world_parallel_mng)
756 m_world_parallel_mng =
this;
758 _messagePassingMng()->setCommunicator(m_communicator);
764SequentialParallelMng::
765~SequentialParallelMng()
767 delete m_parallel_mng_internal;
769 delete m_replication;
776void SequentialParallelMng::
777setBaseObject(IBase* sd)
791 DispatchCreator(ITraceMng* tm) : m_tm(tm){}
793 template<
typename DataType> SequentialParallelDispatchT<DataType>*
796 return new SequentialParallelDispatchT<DataType>(m_tm);
805 m_io_mng = arcaneCreateIOMng(
this);
806 DispatchCreator creator(m_trace.get());
807 this->createDispatchers(creator);
826SequentialParallelSuperMng::
829, m_application(sbi.application())
831, m_timer_mng(nullptr)
839SequentialParallelSuperMng::
842, m_application(sbi.application())
844, m_timer_mng(nullptr)
845, m_communicator(comm)
853SequentialParallelSuperMng::
854~SequentialParallelSuperMng()
871 _setDispatchers(c,i32,i64,r);
882 m_timer_mng = m_owned_timer_mng.get();
899 return SequentialParallelMng::createRef(bi);
919class SequentialParallelMngBuilder
926 ~SequentialParallelMngBuilder()
override
955 bi.setThreadMng(m_thread_mng);
956 bi.setCommunicator(m_communicator);
957 return arcaneCreateSequentialParallelMngRef(bi);
963class SequentialParallelMngContainerFactory
974 ARCANE_UNUSED(nb_rank);
#define ARCANE_THROW(exception_class,...)
Macro pour envoyer une exception avec formattage.
#define ARCANE_FATAL(...)
Macro envoyant une exception FatalErrorException.
#define ARCANE_SERVICE_INTERFACE(ainterface)
Macro pour déclarer une interface lors de l'enregistrement d'un service.
#define ARCANE_REGISTER_APPLICATION_FACTORY(aclass, ainterface, aname)
Enregistre un service de fabrique pour la classe aclass.
Classe de base d'un service.
AbstractService(const ServiceBuildInfo &)
Constructeur à partir d'un ServiceBuildInfo.
Exception lorsqu'un argument est invalide.
Vue modifiable d'un tableau d'un type T.
void copy(const U ©_array)
Recopie le tableau copy_array dans l'instance.
constexpr Integer size() const noexcept
Retourne la taille du tableau.
Tableau d'items de types quelconques.
Vue constante d'un tableau de type T.
constexpr Integer size() const noexcept
Nombre d'éléments du tableau.
Opérations pour accéder aux valeurs de variables d'un autre sous-domaine.
Interface de l'application.
Interface de la classe de base des objets principaux arcane.
virtual ITraceMng * traceMng() const =0
Gestionnaire de traces.
Opérations pour accéder aux valeurs de variables d'un autre sous-domaine.
Interface du gestionnaire des entrées sorties.
Interface d'une famille d'entités.
virtual ItemGroup allItems() const =0
Groupe de toutes les entités.
Gestion des messages parallèles pour le type Type.
Échange d'informations entre processeurs.
Interface d'une fabrique de conteneur de 'IParallelMng'.
Partie interne de IParallelMng.
Interface d'une fabrique pour les fonctions utilitaires de IParallelMng.
Interface du gestionnaire de parallélisme pour un sous-domaine.
virtual char reduce(eReduceType rt, char v)=0
Effectue la réduction de type rt sur le réel v et retourne la valeur.
Interface des opérations parallèles collectives non bloquantes.
Informations sur la réplication des sous-domaines en parallèle.
Classe abstraite du superviseur de parallélisme.
Informations sur la topologie d'allocation des coeurs de calcul.
Interface d'un sérialiseur.
virtual void copy(const ISerializer *from)=0
Copie les données de from dans cette instance.
Interface d'un gestionnaire de thread.
Interface d'un gestionnaire de timer.
Interface du gestionnaire de traces.
virtual TraceMessage info()=0
Flot pour un message d'information.
Envoie de valeurs sur différents processeurs.
Interface d'un service de synchronisation de variable.
Groupe d'entités de maillage.
Communicateur pour l'échange de message.
Classe permettant de créer une fenêtre mémoire pour un noeud de calcul.
Liste de requête de messages.
Interface d'une liste de messages de sérialisation.
Interface d'un message de sérialisation entre IMessagePassingMng.
Gestion des messages parallèles pour le type Type.
Informations sur la source d'un message.
Informations pour envoyer/recevoir un message point à point.
bool isBlocking() const
Indique si le message est bloquant.
Classe de base d'une liste de requêtes.
Liste de messages de sérialisation.
Exception lorsqu'une fonction n'est pas implémentée.
Exception lorsqu'une opération n'est pas supportée.
Gestionnaire de thread en mode mono-thread.
Echange d'informations entre processeurs.
Redirige la gestion des messages des sous-domaines suivant le type de l'argument.
IMessagePassingMng * messagePassingMng() const override
Gestionnaire de message de Arccore associé
Classe de base d'une fabrique pour les fonctions utilitaires de IParallelMng.
Informations sur la réplication des sous-domaines en parallèle.
Informations sur la topologie d'allocation des coeurs de calcul.
virtual void initialize()
Initialise l'instance. Cette opération est collective.
Statistiques sur le parallélisme.
Référence à une instance.
void barrier() const override
Méthode permettant d'attendre que tous les processus/threads du noeud appellent cette méthode pour co...
void resizeSegment(const Int64 new_sizeof_segment) override
Méthode permettant de redimensionner les segments de la fenêtre.
ConstArrayView< Int32 > machineRanks() const override
Méthode permettant d'obtenir les rangs qui possèdent un segment dans la fenêtre.
Span< std::byte > segment(const Int32 rank) const override
Méthode permettant d'obtenir une vue sur le segment d'un autre sous-domaine du noeud.
Int32 sizeofOneElem() const override
Méthode permettant d'obtenir la taille d'un élement de la fenêtre.
Span< std::byte > window() const override
Méthode permettant d'obtenir une vue sur toute la fenêtre.
Span< std::byte > segment() const override
Méthode permettant d'obtenir une vue sur son segment.
Interface des messages pour le type Type.
Ref< IParallelMng > _createParallelMng(Int32 local_rank, ITraceMng *tm) override
Créé le IParallelMng pour le rang local local_rank.
Ref< IParallelMngContainer > _createParallelMngBuilder(Int32 nb_rank, Parallel::Communicator comm) override
Créé un conteneur pour nb_local_rank rangs locaux et avec comme communicateur communicator.
Ref< ITransferValuesParallelOperation > createTransferValuesOperation(IParallelMng *) override
Retourne une opération pour transférer des valeurs entre rangs.
Ref< IVariableSynchronizer > createSynchronizer(IParallelMng *pm, const ItemGroup &group) override
Retourne une interface pour synchroniser des variables sur le groupe group.
Ref< IVariableSynchronizer > createSynchronizer(IParallelMng *pm, IItemFamily *family) override
Retourne une interface pour synchroniser des variables sur le groupe de la famille family.
Ref< IMachineMemoryWindowBaseInternal > createMachineMemoryWindowBase(Int64 sizeof_segment, Int32 sizeof_type) override
Méthode permettant de créer une fenêtre mémoire sur le noeud.
Gestionnaire du parallélisme en mode séquentiel.
Parallel::Communicator communicator() const override
Communicateur MPI associé à ce gestionnaire.
ISerializeMessage * createReceiveSerializer(Int32 rank) override
Créé un message non bloquant pour recevoir des données sérialisées du rang rank.
IParallelNonBlockingCollective * nonBlockingCollective() const override
Interface des opérations collectives non blocantes.
ITransferValuesParallelOperation * createTransferValuesOperation() override
Retourne une opération pour transférer des valeurs entre sous-domaine.
IThreadMng * threadMng() const override
Gestionnaire de threads.
UniqueArray< Integer > testSomeRequests(ArrayView< Request > requests) override
Test si une des requêtes rvalues est terminée.
Int32 commRank() const override
Rang de cette instance dans le communicateur.
ISerializeMessage * createSendSerializer(Int32 rank) override
Créé un message non bloquant pour envoyer des données sérialisées au rang rank.
Int32 commSize() const override
Nombre d'instance dans le communicateur.
IParallelMng * sequentialParallelMng() override
Retourne un gestionnaire de parallélisme séquentiel.
void build() override
Construit l'instance.
void barrier() override
Effectue une barière.
void allGather(ISerializer *send_serializer, ISerializer *recv_serializer) override
Redéfinit ici allGather pour éviter de cacher le symbole dans les classes dérivées.
IGetVariablesValuesParallelOperation * createGetVariablesValuesOperation() override
Retourne une opération pour récupérer les valeurs d'une variable sur les entités d'un autre sous-doma...
IParallelReplication * replication() const override
Informations sur la réplication.
ITimerMng * timerMng() const override
Gestionnaire de timers.
MessageId probe(const PointToPointMessageInfo &message) override
Sonde si des messages sont disponibles.
Ref< IParallelMngUtilsFactory > _internalUtilsFactory() const override
Fabrique des fonctions utilitaires.
MessageSourceInfo legacyProbe(const PointToPointMessageInfo &message) override
Sonde si des messages sont disponibles.
void processMessages(ConstArrayView< ISerializeMessage * > messages) override
Exécute les opérations des messages messages.
bool isMasterIO() const override
true si l'instance est un gestionnaire maître des entrées/sorties.
bool isThreadImplementation() const override
Indique si l'implémentation utilise les threads.
Ref< IRequestList > createRequestListRef() override
Créé une liste de requêtes pour ce gestionnaire.
Parallel::IStat * stat() override
Gestionnaire des statistiques.
void printStats() override
Affiche des statistiques liées à ce gestionnaire du parallélisme.
ITraceMng * traceMng() const override
Gestionnaire de traces.
void initialize() override
Initialise le gestionnaire du parallélisme.
IParallelMng * worldParallelMng() const override
Gestionnaire de parallélisme sur l'ensemble des ressources allouées.
bool isHybridImplementation() const override
Indique si l'implémentation utilise le mode hybride.
IParallelTopology * createTopology() override
Créé une instance contenant les infos sur la topologie des rangs de ce gestionnnaire.
bool isParallel() const override
Retourne true si l'exécution est parallèle.
void setReplication(IParallelReplication *v) override
Positionne les Informations sur la réplication.
void freeRequests(ArrayView< Parallel::Request > requests) override
Libère les requêtes.
void waitAllRequests(ArrayView< Request > requests) override
Bloque en attendant que les requêtes rvalues soient terminées.
UniqueArray< Integer > waitSomeRequests(ArrayView< Request > requests) override
Bloque en attendant qu'une des requêtes rvalues soit terminée.
IParallelMngInternal * _internalApi() override
API interne à Arcane.
void broadcastMemoryBuffer(ByteArray &bytes, Int32 rank) override
Effectue un broadcast d'une zone mémoire.
IVariableSynchronizer * createSynchronizer(const ItemGroup &group) override
Retourne une interface pour synchroniser des variables sur le groupe group.
IIOMng * ioMng() const override
Gestionnaire des entrées/sorties.
Int32 masterIORank() const override
Rang de l'instance gérant les entrées/sorties (pour laquelle isMasterIO() est vrai)
IVariableSynchronizer * createSynchronizer(IItemFamily *family) override
Retourne une interface pour synchroniser des variables sur le groupe de la famille family.
IParallelExchanger * createExchanger() override
Retourne une interface pour transférer des messages entre processeurs.
Request sendSerializer(ISerializer *values, Int32 rank, ByteArray &bytes) override
void * getMPICommunicator() override
Adresse du communicateur MPI associé à ce gestionnaire.
Superviseur du parallélisme en mode séquentiel.
void initialize() override
Initialise l'instance.
Ref< IParallelMng > internalCreateWorldParallelMng(Int32 local_rank) override
Créé un gestionnaire de parallélisme pour l'ensemble des coeurs alloués.
MP::Communicator communicator() const override
Communicateur MPI associé à ce gestionnaire.
void tryAbort() override
Tente de faire un abort.
void build() override
Construction de niveau build du service.
IApplication * m_application
Superviseur associé
IThreadMng * threadMng() const override
Gestionnaire de thread.
void _wait(Parallel::eWaitType wait_mode)
Effectue l'attente ou le test.
Message utilisant un SerializeBuffer.
IApplication * application() const
Accès à l'application IApplication associé.
Structure contenant les informations pour créer un service.
Propriétés de création d'un service.
__host__ __device__ void copy(const U ©_array)
Recopie le tableau copy_array dans l'instance.
Vue d'un tableau d'éléments de type T.
Chaîne de caractères unicode.
TraceAccessor(ITraceMng *m)
Construit un accesseur via le gestionnaire de trace m.
ITraceMng * traceMng() const
Gestionnaire de trace.
Vecteur 1D de données avec sémantique par valeur (style STL).
#define ARCANE_REGISTER_SERVICE(aclass, a_service_property,...)
Macro pour enregistrer un service.
Déclarations des types et méthodes utilisés par les mécanismes d'échange de messages.
eReduceType
Types des réductions supportées.
IStat * createDefaultStat()
Créé une instance par défaut.
-*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-
Ref< TrueType > createRef(Args &&... args)
Créé une instance de type TrueType avec les arguments Args et retourne une référence dessus.
std::int64_t Int64
Type entier signé sur 64 bits.
Int32 Integer
Type représentant un entier.
Array< Byte > ByteArray
Tableau dynamique à une dimension de caractères.
ConstArrayView< Int32 > Int32ConstArrayView
Equivalent C d'un tableau à une dimension d'entiers 32 bits.
@ ST_Application
Le service s'utilise au niveau de l'application.
auto makeRef(InstanceType *t) -> Ref< InstanceType >
Créé une référence sur un pointeur.
std::int32_t Int32
Type entier signé sur 32 bits.
Infos pour construire un SequentialParallelMng.