dc/d71/Test_8cu_8cc_source.html

// -*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-

//-----------------------------------------------------------------------------

// Copyright 2000-2023 CEA (www.cea.fr) IFPEN (www.ifpenergiesnouvelles.com)

// See the top-level COPYRIGHT file for details.

// SPDX-License-Identifier: Apache-2.0

//-----------------------------------------------------------------------------

/*---------------------------------------------------------------------------*/

/* Test.cu.cc                                                  (C) 2000-2023 */

/*                                                                           */

/* Fichier contenant les tests pour l'implémentation HIP.                    */

/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


#include <vector>

#include <iostream>


#include <hip/hip_runtime.h>


#include "arcane/utils/PlatformUtils.h"

#include "arcane/utils/NotSupportedException.h"

#include "arcane/utils/Real3.h"

#include "arcane/Item.h"

#include "arcane/MathUtils.h"


#include "arcane/accelerator/hip/HipAccelerator.h"

#include "arcane/accelerator/Runner.h"

#include "arcane/accelerator/RunQueue.h"

#include "arcane/accelerator/RunCommandLoop.h"

#include "arcane/accelerator/NumArray.h"


using namespace Arccore;

using namespace Arcane;

using namespace Arcane::Accelerator;


__device__ __forceinline__ unsigned int getGlobalIdx_1D_1D()

{

  unsigned int blockId = blockIdx.x;

  unsigned int threadId = blockId * blockDim.x + threadIdx.x;

  return threadId;

}


template <typename T>


struct Privatizer

{

  using value_type = T; //std::decay<T>;

  using reference_type = value_type&;

  value_type priv;


  ARCCORE_HOST_DEVICE Privatizer(const T& o) : priv{o} {}

  ARCCORE_HOST_DEVICE reference_type get_priv() { return priv; }

};


template <typename T>

ARCCORE_HOST_DEVICE auto thread_privatize(const T& item) -> Privatizer<T>

{

  return Privatizer<T>{item};

}


__global__ void MyVecAdd(double* a,double* b,double* out)

{

  int i = blockDim.x * blockIdx.x + threadIdx.x;

  out[i] = a[i] + b[i];

  if (i<10){

    //    printf("A=%d %lf %lf %lf %d\n",i,a[i],b[i],out[i],3);

  }

}


__global__ void MyVecAdd2(Span<const double> a,Span<const double>b,Span<double> out)

{

  Int64 size = a.size();

  Int64 i = blockDim.x * blockIdx.x + threadIdx.x;

  if (i>=size)

    return;

  out[i] = a[i] + b[i];

  if (i<10){

    //printf("A=%d %lf %lf %lf %d\n",i,a[i],b[i],out[i],i);

  }

}


__global__ void MyVecAdd3(MDSpan<const double,MDDim1> a,MDSpan<const double,MDDim1> b,MDSpan<double,MDDim1> out)

{

  Int32 size = static_cast<Int32>(a.extent0());

  Int32 i = blockDim.x * blockIdx.x + threadIdx.x;

  if (i>=size)

    return;

  out(i) = a(i) + b(i);

  if (i<10){

    //printf("A=%d %lf %lf %lf %d\n",i,a(i),b(i),out(i),i);

  }

}


void _initArrays(Span<double> a,Span<double> b,Span<double> c,int base)

{

  Int64 vsize = a.size();

  for( Int64 i = 0; i<vsize; ++i ){

    a[i] = (double)(i+base);

    b[i] = (double)(i*i+base);

    c[i] = 0.0;

  }

}


void _initArrays(MDSpan<double,MDDim1> a,MDSpan<double,MDDim1> b,MDSpan<double,MDDim1> c,int base)

{

  Int32 vsize = static_cast<Int32>(a.extent0());

  for( Int32 i = 0; i<vsize; ++i ){

    a(i) = (double)(i+base);

    b(i) = (double)(i*i+base);

    c(i) = 0.0;

  }

}


template<typename F> __global__

void MyVecLambda(int size,F func)

{

  auto privatizer = thread_privatize(func);

  auto& body = privatizer.get_priv();


  int i = blockDim.x * blockIdx.x + threadIdx.x;

  if (i<size)

    body(i);

}


namespace TestCuda

{


class IA

{

  virtual __device__ __host__ void DoIt2() =0;

};


class A

: public IA

{

 public:

  //__global__ void DoIt(){}

  virtual __device__ __host__ void DoIt2() override {}

};


}


void MyTestFunc1()

{

  struct Context1

  {

    int a;

  };

  auto k = [=](Context1& ctx){ std::cout << "A=" << ctx.a << "\n"; };

  Context1 my_ctx;

  my_ctx.a = 3;

  k(my_ctx);

}


extern "C"

int arcaneTestHip1()

{

  constexpr int vsize = 2000;

  std::vector<double> a(vsize);

  std::vector<double> b(vsize);

  std::vector<double> out(vsize);

  for( size_t i = 0; i<vsize; ++i ){

    a[i] = (double)(i+1);

    b[i] = (double)(i*i+1);

    out[i] = 0.0; //a[i] + b[i];

  }

  size_t mem_size = vsize*sizeof(double);

  double* d_a = nullptr;

  ARCANE_CHECK_HIP(hipMalloc(&d_a,mem_size));

  double* d_b = nullptr;

  ARCANE_CHECK_HIP(hipMalloc(&d_b,mem_size));

  double* d_out = nullptr;

  ARCANE_CHECK_HIP(hipMalloc(&d_out,mem_size));


  ARCANE_CHECK_HIP(hipMemcpy(d_a, a.data(), mem_size, hipMemcpyHostToDevice));

  ARCANE_CHECK_HIP(hipMemcpy(d_b, b.data(), mem_size, hipMemcpyHostToDevice));

  int threadsPerBlock = 256;

  int blocksPerGrid = (vsize + threadsPerBlock - 1) / threadsPerBlock;

  std::cout << "CALLING kernel tpb=" << threadsPerBlock << " bpg=" << blocksPerGrid << "\n";

  hipLaunchKernelGGL(MyVecAdd, blocksPerGrid, threadsPerBlock , 0, 0, d_a,d_b,d_out);

  ARCANE_CHECK_HIP(hipDeviceSynchronize());

  ARCANE_CHECK_HIP(hipMemcpy(out.data(), d_out, mem_size, hipMemcpyDeviceToHost));

  for( size_t i=0; i<10; ++i )

    std::cout << "V=" << out[i] << "\n";

  return 0;

}


extern "C"

int arcaneTestHip2()

{

  MyTestFunc1();

  constexpr int vsize = 2000;

  size_t mem_size = vsize*sizeof(double);

  double* d_a = nullptr;

  ARCANE_CHECK_HIP(hipMallocManaged(&d_a,mem_size,hipMemAttachGlobal));

  double* d_b = nullptr;

  ARCANE_CHECK_HIP(hipMallocManaged(&d_b,mem_size,hipMemAttachGlobal));

  double* d_out = nullptr;

  ARCANE_CHECK_HIP(hipMallocManaged(&d_out,mem_size,hipMemAttachGlobal));


  //d_a = new double[vsize];

  //d_b = new double[vsize];

  //d_out = new double[vsize];


  for( size_t i = 0; i<vsize; ++i ){

    d_a[i] = (double)(i+1);

    d_b[i] = (double)(i*i+1);

    d_out[i] = 0.0; //a[i] + b[i];

  }


  //hipMemcpy(d_a, a.data(), mem_size, hipMemcpyHostToDevice);

  //hipMemcpy(d_b, b.data(), mem_size, hipMemcpyHostToDevice);

  int threadsPerBlock = 256;

  int blocksPerGrid = (vsize + threadsPerBlock - 1) / threadsPerBlock;

  std::cout << "CALLING kernel2 tpb=" << threadsPerBlock << " bpg=" << blocksPerGrid << "\n";

  hipLaunchKernelGGL(MyVecAdd, blocksPerGrid, threadsPerBlock, 0, 0, d_a,d_b,d_out);

  ARCANE_CHECK_HIP(hipDeviceSynchronize());

  hipError_t e = hipGetLastError();

  std::cout << "END OF MYVEC1 e=" << e << " v=" << hipGetErrorString(e) << "\n";

  //hipDeviceSynchronize();

  //e = hipGetLastError();

  //std::cout << "END OF MYVEC2 e=" << e << " v=" << hipGetErrorString(e) << "\n";

  //hipMemcpy(out.data(), d_out, mem_size, hipMemcpyDeviceToHost);

  //e = hipGetLastError();

  //std::cout << "END OF MYVEC3 e=" << e << " v=" << hipGetErrorString(e) << "\n";

  for( size_t i=0; i<10; ++i )

    std::cout << "V=" << d_out[i] << "\n";


  return 0;

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


extern "C"

int arcaneTestHip3()

{

  std::cout << "TEST_HIP_3\n";

  constexpr int vsize = 2000;

  IMemoryAllocator* hip_allocator = Arcane::Accelerator::Hip::getHipMemoryAllocator();

  IMemoryAllocator* hip_allocator2 = Arcane::platform::getAcceleratorHostMemoryAllocator();

  if (!hip_allocator2)

    ARCANE_FATAL("platform::getAcceleratorHostMemoryAllocator() is null");

  UniqueArray<double> d_a(hip_allocator,vsize);

  MyTestFunc1();

  UniqueArray<double> d_b(hip_allocator,vsize);

  UniqueArray<double> d_out(hip_allocator,vsize);


  for( size_t i = 0; i<vsize; ++i ){

    d_a[i] = (double)(i+1);

    d_b[i] = (double)(i*i+1);

    d_out[i] = 0.0; //a[i] + b[i];

  }


  int threadsPerBlock = 256;

  int blocksPerGrid = (vsize + threadsPerBlock - 1) / threadsPerBlock;

  std::cout << "CALLING kernel2 tpb=" << threadsPerBlock << " bpg=" << blocksPerGrid << "\n";

  hipLaunchKernelGGL(MyVecAdd2, blocksPerGrid, threadsPerBlock, 0, 0, d_a,d_b,d_out);

  ARCANE_CHECK_HIP(hipDeviceSynchronize());

  hipError_t e = hipGetLastError();

  std::cout << "END OF MYVEC1 e=" << e << " v=" << hipGetErrorString(e) << "\n";

  for( size_t i=0; i<10; ++i )

    std::cout << "V=" << d_out[i] << "\n";


  // Lance un noyau dynamiquement

  {

    _initArrays(d_a,d_b,d_out,2);


    dim3 dimGrid(threadsPerBlock, 1, 1), dimBlock(blocksPerGrid, 1, 1);


    Span<const double> d_a_span = d_a.span();

    Span<const double> d_b_span = d_b.span();

    Span<double> d_out_view = d_out.span();


    void *kernelArgs[] = {

      (void*)&d_a_span,

      (void*)&d_b_span,

      (void*)&d_out_view

    };

    size_t smemSize = 0;

    hipStream_t stream;

    ARCANE_CHECK_HIP(hipStreamCreateWithFlags(&stream, hipStreamNonBlocking));

    ARCANE_CHECK_HIP(hipLaunchKernel((void *)MyVecAdd2, dimGrid, dimBlock, kernelArgs, smemSize, stream));

    ARCANE_CHECK_HIP(hipStreamSynchronize(stream));

    for( size_t i=0; i<10; ++i )

      std::cout << "V2=" << d_out[i] << "\n";

  }


  // Lance une lambda

  {

    _initArrays(d_a,d_b,d_out,3);

    Span<const double> d_a_span = d_a.span();

    Span<const double> d_b_span = d_b.span();

    Span<double> d_out_span = d_out.span();

    auto func = [=] ARCCORE_HOST_DEVICE (int i)

                {

                  d_out_span[i] = d_a_span[i] + d_b_span[i];

                  if (i<10){

                    //printf("A=%d %lf %lf %lf\n",i,d_a_span[i],d_b_span[i],d_out_span[i]);

                  }};


    hipLaunchKernelGGL(MyVecLambda, blocksPerGrid, threadsPerBlock, 0, 0, vsize,func);

    ARCANE_CHECK_HIP(hipDeviceSynchronize());

    for( size_t i=0; i<10; ++i )

      std::cout << "V3=" << d_out[i] << "\n";


    _initArrays(d_a,d_b,d_out,4);


    // Appelle la version 'hote' de la lambda

    for( int i=0; i<vsize; ++i )

      func(i);

    for( size_t i=0; i<10; ++i )

      std::cout << "V4=" << d_out[i] << "\n";

  }


  // Utilise les Real3

  {

    UniqueArray<Real3> d_a3(hip_allocator,vsize);

    UniqueArray<Real3> d_b3(hip_allocator,vsize);

    for( Integer i=0; i<vsize; ++i ){

      Real a = (Real)(i+2);

      Real b = (Real)(i*i+3);


      d_a3[i] = Real3(a,a+1.0,a+2.0);

      d_b3[i] = Real3(b,b+2.0,b+3.0);

    }


    Span<const Real3> d_a3_span = d_a3.span();

    Span<const Real3> d_b3_span = d_b3.span();

    Span<double> d_out_span = d_out.span();

    auto func2 = [=] ARCCORE_HOST_DEVICE (int i) {

                   d_out_span[i] = math::dot(d_a3_span[i],d_b3_span[i]);

                   if (i<10){

                     //printf("DOT=%d %lf\n",i,d_out_span[i]);

                   }

                 };

    hipLaunchKernelGGL(MyVecLambda, blocksPerGrid, threadsPerBlock, 0, 0, vsize,func2);

    ARCANE_CHECK_HIP(hipDeviceSynchronize());

    std::cout << "TEST WITH REAL3\n";

  }


  return 0;

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


extern "C"

int arcaneTestHipNumArray()

{

  std::cout << "TEST_HIP_NUM_ARRAY\n";

  constexpr int vsize = 2000;

  //IMemoryAllocator* hip_allocator = Arcane::Accelerator::Hip::getHipMemoryAllocator();

  IMemoryAllocator* hip_allocator2 = Arcane::platform::getAcceleratorHostMemoryAllocator();

  if (!hip_allocator2)

    ARCANE_FATAL("platform::getAcceleratorHostMemoryAllocator() is null");

  NumArray<double,MDDim1> d_a;

  MyTestFunc1();

  NumArray<double,MDDim1> d_b;

  NumArray<double,MDDim1> d_out;

  d_a.resize(vsize);

  d_b.resize(vsize);

  d_out.resize(vsize);

  for( int i = 0; i<vsize; ++i ){

    d_a(i) = (double)(i+1);

    d_b(i) = (double)(i*i+1);

    d_out(i) = 0.0; //a[i] + b[i];

  }


  int threadsPerBlock = 256;

  int blocksPerGrid = (vsize + threadsPerBlock - 1) / threadsPerBlock;

  std::cout << "CALLING kernel2 tpb=" << threadsPerBlock << " bpg=" << blocksPerGrid << "\n";

  hipLaunchKernelGGL(MyVecAdd3, blocksPerGrid, threadsPerBlock, 0, 0, d_a,d_b,d_out);

  ARCANE_CHECK_HIP(hipDeviceSynchronize());

  hipError_t e = hipGetLastError();

  std::cout << "END OF MYVEC1 e=" << e << " v=" << hipGetErrorString(e) << "\n";

  for( int i=0; i<10; ++i )

    std::cout << "V=" << d_out(i) << "\n";


  // Lance un noyau dynamiquement

  {

    _initArrays(d_a,d_b,d_out,2);


    dim3 dimGrid(threadsPerBlock, 1, 1), dimBlock(blocksPerGrid, 1, 1);


    MDSpan<const double,MDDim1> d_a_span = d_a.constSpan();

    MDSpan<const double,MDDim1> d_b_span = d_b.constSpan();

    MDSpan<double,MDDim1> d_out_view = d_out.span();


    void *kernelArgs[] = {

      (void*)&d_a_span,

      (void*)&d_b_span,

      (void*)&d_out_view

    };

    size_t smemSize = 0;

    hipStream_t stream;

    ARCANE_CHECK_HIP(hipStreamCreateWithFlags(&stream, hipStreamNonBlocking));

    ARCANE_CHECK_HIP(hipLaunchKernel((void *)MyVecAdd2, dimGrid, dimBlock, kernelArgs, smemSize, stream));

    ARCANE_CHECK_HIP(hipStreamSynchronize(stream));

    for( int i=0; i<10; ++i )

      std::cout << "V2=" << d_out(i) << "\n";

  }


  // Lance une lambda

  {

    _initArrays(d_a,d_b,d_out,3);

    MDSpan<const double,MDDim1> d_a_span = d_a.constSpan();

    MDSpan<const double,MDDim1> d_b_span = d_b.constSpan();

    MDSpan<double,MDDim1> d_out_span = d_out.span();

    auto func = [=] ARCCORE_HOST_DEVICE (int i)

                {

                  d_out_span(i) = d_a_span(i) + d_b_span(i);

                  if (i<10){

                    //printf("A=%d %lf %lf %lf\n",i,d_a_span(i),d_b_span(i),d_out_span(i));

                  }};


    hipLaunchKernelGGL(MyVecLambda, blocksPerGrid, threadsPerBlock, 0, 0, vsize,func);

    ARCANE_CHECK_HIP(hipDeviceSynchronize());

    for( int i=0; i<10; ++i )

      std::cout << "V3=" << d_out(i) << "\n";


    _initArrays(d_a,d_b,d_out,4);


    // Appelle la version 'hote' de la lambda

    for( int i=0; i<vsize; ++i )

      func(i);

    for( int i=0; i<10; ++i )

      std::cout << "V4=" << d_out(i) << "\n";

  }


  // Utilise les Real3 avec un tableau multi-dimensionel

  {

    NumArray<Real,MDDim2> d_a3(vsize,3);

    NumArray<Real,MDDim2> d_b3(vsize,3);

    for( Integer i=0; i<vsize; ++i ){

      Real a = (Real)(i+2);

      Real b = (Real)(i*i+3);


      d_a3(i,0) = a;

      d_a3(i,1) = a + 1.0;

      d_a3(i,2) = a + 2.0;


      d_b3(i,0) = b;

      d_b3(i,1) = b + 1.0;

      d_b3(i,2) = b + 2.0;

    }


    MDSpan<const Real,MDDim2> d_a3_span = d_a3.constSpan();

    MDSpan<const Real,MDDim2> d_b3_span = d_b3.constSpan();

    MDSpan<double,MDDim1> d_out_span = d_out.span();

    auto func2 = [=] ARCCORE_HOST_DEVICE (int i) {

                   Real3 xa(d_a3_span(i,0),d_a3_span(i,1),d_a3_span(i,2));

                   Real3 xb(d_b3_span(i,0),d_b3_span(i,1),d_b3_span(i,2));

                   d_out_span(i) = math::dot(xa,xb);

                   if (i<10){

                     //printf("DOT NUMARRAY=%d %lf\n",i,d_out_span(i));

                   }

                 };

    hipLaunchKernelGGL(MyVecLambda, blocksPerGrid, threadsPerBlock, 0, 0, vsize,func2);

    ARCANE_CHECK_HIP(hipDeviceSynchronize());

    std::cout << "TEST WITH REAL3\n";

  }


  return 0;

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


#include "arcane/accelerator/Reduce.h"


namespace ax = Arcane::Accelerator;


void arcaneTestHipReductionX(int vsize,ax::RunQueue& queue,const String& name)

{

  using namespace Arcane::Accelerator;

  std::cout << "TestReduction vsize=" << vsize << "\n";

  IMemoryAllocator* hip_allocator2 = Arcane::platform::getAcceleratorHostMemoryAllocator();

  UniqueArray<int> d_a(hip_allocator2,vsize);

  UniqueArray<int> d_out(hip_allocator2,vsize);


  for( Integer i=0; i<vsize; ++i ){

    int a = 5 + ((i+2) % 43);

    d_a[i] = a;

    d_out[i] = 0;

    //std::cout << "I=" << i << " a=" << a << "\n";

  }

  RunCommand command = makeCommand(queue);

  ReducerSum<int> sum_reducer(command);

  ReducerSum<double> sum_double_reducer(command);

  ReducerMax<int> max_int_reducer(command);

  ReducerMax<double> max_double_reducer(command);

  ReducerMin<int> min_int_reducer(command);

  ReducerMin<double> min_double_reducer(command);

  Span<const int> xa = d_a.span();

  Span<int> xout = d_out.span();

  command << RUNCOMMAND_LOOP1(idx, vsize)

  {

    auto [i] = idx();

    double vxa = (double)(xa[i]);

    xout[i] = xa[i];

    sum_reducer.add(xa[i]);

    sum_double_reducer.add(vxa);

    max_int_reducer.max(xa[i]);

    max_double_reducer.max(vxa);

    min_int_reducer.min(xa[i]);

    min_double_reducer.min(vxa);

    //if (i<10)

    //printf("Do Reduce i=%d v=%d %lf\n",i,xa[i],vxa);

  };


  int sum_int_value = sum_reducer.reduce();

  double sum_double_value = sum_double_reducer.reduce();

  std::cout << "SumReducer name=" << name << " v_int=" << sum_int_value

            << " v_double=" << sum_double_value

            << "\n";

  int max_int_value = max_int_reducer.reduce();

  double max_double_value = max_double_reducer.reduce();

  std::cout << "MaxReducer name=" << name << " v_int=" << max_int_value

            << " v_double=" << max_double_value

            << "\n";

  int min_int_value = min_int_reducer.reduce();

  double min_double_value = min_double_reducer.reduce();

  std::cout << "MinReducer name=" << name << " v_int=" << min_int_value

            << " v_double=" << min_double_value

            << "\n";

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


extern "C"

int arcaneTestHipReduction()

{

  // TODO: tester en ne commancant pas par 0.

  ax::Runner runner_seq(ax::eExecutionPolicy::Sequential);

  ax::Runner runner_thread(ax::eExecutionPolicy::Thread);

  ax::Runner runner_hip(ax::eExecutionPolicy::HIP);

  runner_hip.setDeviceReducePolicy(ax::eDeviceReducePolicy::Grid);

  ax::RunQueue queue1{makeQueue(runner_seq)};

  ax::RunQueue queue2{makeQueue(runner_thread)};

  ax::RunQueue queue3{makeQueue(runner_hip)};

  int sizes_to_test[] = { 56, 567, 4389, 452182 };

  for( int i=0; i<4; ++i ){

    int vsize = sizes_to_test[i];

    arcaneTestHipReductionX(vsize,queue1,"Sequential");

    arcaneTestHipReductionX(vsize,queue2,"Thread");

    arcaneTestHipReductionX(vsize,queue3,"HIP");

  }

  return 0;

}

ARCANE_FATAL
#define ARCANE_FATAL(...)
Macro envoyant une exception FatalErrorException.
Definition ArcaneGlobal.h:768

Reduce.h
Types et fonctions pour gérer les synchronisations sur les accélérateurs.

RunCommandLoop.h
Types et macros pour gérer les boucles sur les accélérateurs.

RUNCOMMAND_LOOP1
#define RUNCOMMAND_LOOP1(iter_name, x1,...)
Boucle sur accélérateur avec arguments supplémentaires pour les réductions.
Definition RunCommandLoop.h:235

Arcane::Accelerator::ReducerMax
Classe pour effectuer une réduction 'max'.
Definition Reduce.h:680

Arcane::Accelerator::ReducerMin
Classe pour effectuer une réduction 'min'.
Definition Reduce.h:715

Arcane::Accelerator::ReducerSum
Classe pour effectuer une réduction 'somme'.
Definition Reduce.h:648

Arcane::Accelerator::RunCommand
Gestion d'une commande sur accélérateur.
Definition core/RunCommand.h:46

Arcane::Accelerator::RunQueue
File d'exécution pour un accélérateur.
Definition core/RunQueue.h:52

Arcane::Accelerator::Runner
Gestionnaire d'exécution pour accélérateur.
Definition core/Runner.h:68

Arcane::IMemoryAllocator
Interface d'un allocateur pour la mémoire.
Definition arccore/src/collections/arccore/collections/IMemoryAllocator.h:45

Arcane::MDSpan
Classe de base des vues multi-dimensionnelles.
Definition MDSpan.h:44

Arcane::NumArray
Tableaux multi-dimensionnels pour les types numériques accessibles sur accélérateurs.
Definition utils/NumArray.h:58

Arcane::NumArray::span
MDSpanType span()
Vue multi-dimension sur l'instance.
Definition utils/NumArray.h:643

Arcane::NumArray::constSpan
ConstMDSpanType constSpan() const
Vue constante multi-dimension sur l'instance.
Definition utils/NumArray.h:651

Arcane::NumArray::resize
void resize(Int32 dim1_size)
Modifie la taille du tableau en gardant pas les valeurs actuelles.
Definition utils/NumArray.h:301

Arcane::Real3
Classe gérant un vecteur de réel de dimension 3.
Definition Real3.h:132

Arcane::Span
Vue d'un tableau d'éléments de type T.
Definition Span.h:513

Arcane::String
Chaîne de caractères unicode.
Definition arccore/src/base/arccore/base/String.h:70

Arcane::UniqueArray
Vecteur 1D de données avec sémantique par valeur (style STL).
Definition arccore/src/collections/arccore/collections/Array.h:1844

TestCuda::A
Definition Test.cu.cc:132

TestCuda::IA
Definition Test.cu.cc:126

Arcane::math::dot
__host__ __device__ Real dot(Real2 u, Real2 v)
Produit scalaire de u par v dans .
Definition MathUtils.h:96

Arcane::Accelerator
Espace de nom pour l'utilisation des accélérateurs.
Definition AcceleratorGlobal.h:36

Arcane::Accelerator::makeCommand
RunCommand makeCommand(const RunQueue &run_queue)
Créé une commande associée à la file run_queue.
Definition core/RunQueue.h:283

Arcane::Accelerator::eDeviceReducePolicy::Grid
@ Grid
Utilise un noyau de calcul avec une synchronisations entre les blocs.
Definition AcceleratorCoreGlobal.h:123

Arcane::Accelerator::makeQueue
RunQueue makeQueue(const Runner &runner)
Créé une file associée à runner.
Definition core/Runner.h:222

Arcane::Accelerator::eExecutionPolicy::HIP
@ HIP
Politique d'exécution utilisant l'environnement HIP.
Definition AcceleratorCoreGlobal.h:103

Arcane::Accelerator::eExecutionPolicy::Sequential
@ Sequential
Politique d'exécution séquentielle.
Definition AcceleratorCoreGlobal.h:97

Arcane::Accelerator::eExecutionPolicy::Thread
@ Thread
Politique d'exécution multi-thread.
Definition AcceleratorCoreGlobal.h:99

Arcane::platform::getAcceleratorHostMemoryAllocator
IMemoryAllocator * getAcceleratorHostMemoryAllocator()
Allocateur spécifique pour les accélérateurs.
Definition arcane/src/arcane/utils/PlatformUtils.cc:229

Arcane
-*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-
Definition AcceleratorGlobal.h:36

Arcane::Integer
Int32 Integer
Type représentant un entier.
Definition ArccoreGlobal.h:240

Arccore
Espace de nom de Arccore.
Definition CaseOptionList.cc:764

Privatizer
Definition Test.cu.cc:44