La notion de concurrence est implémentée dans Arcane via la notion de tâche.
Cette notion de tâche permet l'exécution concurrente de plusieurs opérations via les threads.
Cette notion est complémentaire de la notion de décomposition de domaine utilisée par le Arcane::IParallelMng. Il est donc tout à fait possible de mélanger décomposition de domaine et les threads.
- Avertissement
- Néanmoins, si l'implémentation de Arcane::IParallelMng se fait via MPI, il est déconseillé de faire des appels au Arcane::IParallelMng lorsque des tâches se déroulent de manière concurrente, par exemle dans les boucles parallélisées. La plupart des implémentations MPI ne sont pas très performantes dans ce mode et certaines ne le supporte que partiellement.
Pour utiliser les tâches, il faut inclure le fichier suivant :
#include "arcane/Concurrency.h"
Il existe deux mécanismes pour utiliser les tâches :
- Implicitement via la notion de boucle parallèle
- explicitement en créant les tâches directement
La première solution est la plus simple et doit être envisagée en priorité.
Activation
Par défaut, le support de la concurrence est désactivé. L'activation se fait avant le lancement du code, en spécifiant le nombre de tâches pouvant s'exécuter de manière concurrentes lors de la ligne de commande (se reporter à la page Lancement d'un calcul pour savoir comment faire cela).
Il est possible de savoir dans le code si la concurrence est active en appelant la méthode Arcane::TaskFactory::isActive().
Il n'est pas possible d'activer la concurrence pendant l'exécution.
Boucles parallèles
Il existe deux formes de boucles parallèles. La première forme s'applique sur les boucles classiques, la seconde sur les groupes d'entités.
Le mécanisme de fonctionnement est similaire aux directives omp parallel for
de OpenMp.
- Avertissement
- L'utilisateur de ce mécanisme doit s'assurer que la boucle peut être correctement parallélisée sans qu'il y ait d'effets de bord. Notamment, cela inclut (mais ne se limite pas) la garantie que les itérations de la boucle sont indépendantes, qu'il n'y a pas d'opérations de sortie de boucle (return, break).
La première forme est pour paralléliser la boucle séquentielle suivante :
void func()
{
for( Integer i=0; i<n; ++i )
p[i] = (gamma[i]-1) * rho[i] * e[i];
}
La parallélisation se fait comme suit : il faut d'abord écrire une classe fonctor qui représente l'opération que l'on souhaite effectuée sur un interval d'itération. Ensuite, il faut utiliser l'opération arcaneParallelFor() en spécifiant ce fonctor en argument comme suit :
class Func
{
public:
void exec(Integer begin,Integer size)
{
for( Integer i=begin; i<(begin+size); ++i )
p[i] = (gamma[i]-1) * rho[i] * e[i];
}
};
void func()
{
Func my_functor;
}
void arcaneParallelFor(Integer i0, Integer size, InstanceType *itype, void(InstanceType::*lambda_function)(Integer i0, Integer size))
Applique en concurrence la fonction lambda lambda_function sur l'intervalle d'itération [i0,...
Cette syntaxe est un peu verbeuse. Si le compilateur supporte la norme C++11, il est possible d'utiliser les lambda function pour simplifier l'écriture :
void func()
{
for( Integer i=begin; i<(begin+size); ++i )
p[i] = (gamma[i]-1.0) * rho[i] * e[i];
});
}
Une spécialisation existe pour les groupes d'entités. Pour paralléliser une énumération sur un groupe comme le code suivant :
void func()
{
p[icell] = (gamma[icell]-1.0) * rho[icell] * e[icell];
}
}
Il faut écrire comme cela :
class Func
{
public:
{
p[icell] = (gamma[icell]-1.0) * rho[icell] * e[icell];
}
}
};
void func()
{
Func my_functor;
arcaneParallelForeach(my_group,&my_functor,&Func::exec);
}
Vue sur un tableau typé d'entités.
-*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-
De même, avec le support du C++11, on peut simplifier :
void func()
{
p[icell] = (gamma[icell]-1.0) * rho[icell] * e[icell];
}
});
}
Pour les boucles Arcane::arcaneParallelFor() et Arcane::arcaneParallelForeach(), il est possible de passer en argument une instance de ParallelLoopOptions pour configurer la boucle parallèle. Par exemple, il est possible de spécifier la taille de l'intervalle pour découper la boucle :
void func()
{
p[icell] = (gamma[icell]-1.0) * rho[icell] * e[icell];
}
});
}
Options d'exécution d'une boucle parallèle en multi-thread.
void setGrainSize(Integer v)
Positionne la taille (approximative) d'un intervalle d'itération.
void arcaneParallelForeach(const ItemVectorView &items_view, const ForLoopRunInfo &run_info, InstanceType *instance, void(InstanceType::*function)(ItemVectorViewT< ItemType > items))
Applique en concurrence la méthode function de l'instance instance sur la vue items_view avec les opt...
Utilisation explicite des tâches
La création d'un tâche se fait via la fabrique de tâche. Il faut spécifier en argument un fonctor de la même manière que les boucles parallèles :
class Func
{
public:
{
}
};
void func()
{
Func my_functor
}
Interface d'une tâche concourante.
Contexte d'éxecution d'une tâche.
static ITask * createTask(InstanceType *instance, void(InstanceType::*function)(const TaskContext &tc))
Créé une tâche. Lors de l'exécution, la tâche appellera la méthode function via l'instance instance.
Une fois la tâche créée, il est possible de la lancer et d'attendre sa terminaison via la méthode ITask::launchAndWait(). Pour des raisons de simplicité, la tâche n'est pas lancée tant que cette méthode n'a pas été appelée.
Il est possible de créer des sous-tâches à partir d'une première tâche via la méthode Arcane::TaskFactory::createChildTask(). L'utilisateur doit gérer le lancement et l'attente des sous-tâches. Par exemple :
ITask* master_task = TaskFactory::createTask(...);
sub_tasks.
add(TaskFactory::createChildTask(master_task,&my_functor,&Func::exec);
sub_tasks.
add(TaskFactory::createChildTask(master_task,&my_functor,&Func::exec);
virtual void launchAndWait()=0
Lance la tâche et bloque jusqu'à ce qu'elle se termine.
void add(ConstReferenceType val)
Ajoute l'élément val à la fin du tableau.
Vecteur 1D de données avec sémantique par valeur (style STL).
L'exemple complet suivant montre l'implémentation du calcul d'une suite de Fibonacci via le mécanisme des tâches.
class Fibonnaci
{
public:
const long n;
long* const sum;
Fibonnaci( long n_, long* sum_ ) : n(n_), sum(sum_)
{}
{
if( n<10 ) {
*sum = SerialFib(n);
}
else {
long x, y;
Fibonnaci a(n-1,&x);
Fibonnaci b(n-2,&y);
child_tasks[0] = TaskFactory::createChildTask(parent_task,&a,&Test5Fibonnaci::execute);
child_tasks[1] = TaskFactory::createChildTask(parent_task,&b,&Test5Fibonnaci::execute);
*sum = x+y;
}
}
static long SerialFib( long n )
{
if( n<2 )
return n;
else
return SerialFib(n-1)+SerialFib(n-2);
}
static long ParallelFib( long n )
{
long sum;
Test5Fibonnaci a(n,&sum);
ITask* task = TaskFactory::createTask(&a,&Test5Fibonnaci::execute);
return sum;
}
};
ITask * task() const
Tâche courante.
Vue constante d'un tableau de type T.