d4/dc1/SyclAcceleratorRuntime_8cc_source.html

// -*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-

//-----------------------------------------------------------------------------

// Copyright 2000-2025 CEA (www.cea.fr) IFPEN (www.ifpenergiesnouvelles.com)

// See the top-level COPYRIGHT file for details.

// SPDX-License-Identifier: Apache-2.0

//-----------------------------------------------------------------------------

/*---------------------------------------------------------------------------*/

/* SyclAcceleratorRuntime.cc                                   (C) 2000-2025 */

/*                                                                           */

/* Runtime pour 'SYCL'.                                                      */

/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


#include "arccore/accelerator_native/SyclAccelerator.h"


#include "arccore/base/FatalErrorException.h"

#include "arccore/base/NotImplementedException.h"

#include "arccore/base/NotSupportedException.h"


#include "arccore/common/AlignedMemoryAllocator.h"

#include "arccore/common/AllocatedMemoryInfo.h"

#include "arccore/common/internal/MemoryUtilsInternal.h"

#include "arccore/common/internal/IMemoryResourceMngInternal.h"


#include "arccore/common/accelerator/RunQueueBuildInfo.h"

#include "arccore/common/accelerator/Memory.h"

#include "arccore/common/accelerator/DeviceInfoList.h"

#include "arccore/common/accelerator/KernelLaunchArgs.h"

#include "arccore/common/accelerator/RunQueue.h"

#include "arccore/common/accelerator/DeviceMemoryInfo.h"

#include "arccore/common/accelerator/NativeStream.h"

#include "arccore/common/accelerator/internal/IRunnerRuntime.h"

#include "arccore/common/accelerator/internal/RegisterRuntimeInfo.h"

#include "arccore/common/accelerator/internal/RunCommandImpl.h"

#include "arccore/common/accelerator/internal/IRunQueueStream.h"

#include "arccore/common/accelerator/internal/IRunQueueEventImpl.h"


namespace Arcane::Accelerator::Sycl

{


#define ARCCORE_SYCL_FUNC_NOT_HANDLED \

  std::cout << "WARNING: SYCL: function not handled " << A_FUNCINFO << "\n"


class SyclRunnerRuntime;


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


// Cette file est utilisée pour les allocations.

// Elle doit donc toujours exister car on ne sait pas quand aura lieu

// la dernière désallocation.

sycl::queue global_default_queue;

namespace

{

  sycl::queue& _defaultQueue()

  {

    return global_default_queue;

  }

} // namespace


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


class SyclMemoryAllocatorBase

: public AlignedMemoryAllocator

{

 public:


  SyclMemoryAllocatorBase()

  : AlignedMemoryAllocator(128)

  {}


  bool hasRealloc(MemoryAllocationArgs) const override { return true; }


  AllocatedMemoryInfo allocate(MemoryAllocationArgs args, Int64 new_size) override

  {

    sycl::queue& q = _defaultQueue();

    void* out = nullptr;

    _allocate(&out, new_size, args, q);

    if (!out)

      ARCCORE_FATAL("Can not allocate memory size={0}", new_size);

    Int64 a = reinterpret_cast<Int64>(out);

    if ((a % 128) != 0)

      ARCCORE_FATAL("Bad alignment for SYCL allocator: offset={0}", (a % 128));

    return { out, new_size };

  }


  AllocatedMemoryInfo reallocate(MemoryAllocationArgs args, AllocatedMemoryInfo current_ptr, Int64 new_size) override

  {

    sycl::queue& q = _defaultQueue();

    AllocatedMemoryInfo a = allocate(args, new_size);

    q.submit([&](sycl::handler& cgh) {

      cgh.memcpy(a.baseAddress(), current_ptr.baseAddress(), current_ptr.size());

    });

    q.wait();


    deallocate(args, current_ptr);

    return a;

  }


  void deallocate(MemoryAllocationArgs args, AllocatedMemoryInfo ptr) override

  {

    sycl::queue& q = _defaultQueue();

    _deallocate(ptr.baseAddress(), args, q);

  }


 protected:


  virtual void _allocate(void** ptr, size_t new_size, MemoryAllocationArgs, sycl::queue& q) = 0;

  virtual void _deallocate(void* ptr, MemoryAllocationArgs, sycl::queue& q) = 0;

};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


class UnifiedMemorySyclMemoryAllocator

: public SyclMemoryAllocatorBase

{

 protected:


  void _allocate(void** ptr, size_t new_size, MemoryAllocationArgs, sycl::queue& q) override

  {

    *ptr = sycl::malloc_shared(new_size, q);

  }

  void _deallocate(void* ptr, MemoryAllocationArgs, sycl::queue& q) override

  {

    sycl::free(ptr, q);

  }

  eMemoryResource memoryResource() const override { return eMemoryResource::UnifiedMemory; }

};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


class HostPinnedSyclMemoryAllocator

: public SyclMemoryAllocatorBase

{

 protected:


  void _allocate(void** ptr, size_t new_size, MemoryAllocationArgs, sycl::queue& q) override

  {

    // TODO: Faire host-pinned

    *ptr = sycl::malloc_host(new_size, q);

  }

  void _deallocate(void* ptr, MemoryAllocationArgs, sycl::queue& q) override

  {

    sycl::free(ptr, q);

  }

  eMemoryResource memoryResource() const override { return eMemoryResource::HostPinned; }

};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


class DeviceSyclMemoryAllocator

: public SyclMemoryAllocatorBase

{

 protected:


  void _allocate(void** ptr, size_t new_size, MemoryAllocationArgs, sycl::queue& q) override

  {

    *ptr = sycl::malloc_device(new_size, q);

  }

  void _deallocate(void* ptr, MemoryAllocationArgs, sycl::queue& q) override

  {

    sycl::free(ptr, q);

  }

  eMemoryResource memoryResource() const override { return eMemoryResource::Device; }

};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


namespace

{

  UnifiedMemorySyclMemoryAllocator unified_memory_sycl_memory_allocator;

  HostPinnedSyclMemoryAllocator host_pinned_sycl_memory_allocator;

  DeviceSyclMemoryAllocator device_sycl_memory_allocator;

} // namespace


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


class SyclRunQueueStream

: public impl::IRunQueueStream

{

 public:


  SyclRunQueueStream(SyclRunnerRuntime* runtime, const RunQueueBuildInfo& bi);

  ~SyclRunQueueStream() override

  {

  }


 public:


  void notifyBeginLaunchKernel([[maybe_unused]] impl::RunCommandImpl& c) override

  {

    return m_runtime->notifyBeginLaunchKernel();

  }


  void notifyEndLaunchKernel(impl::RunCommandImpl&) override

  {

    return m_runtime->notifyEndLaunchKernel();

  }


  void barrier() override

  {

    m_sycl_stream->wait_and_throw();

  }


  bool _barrierNoException() override

  {

    m_sycl_stream->wait();

    return false;

  }


  void copyMemory(const MemoryCopyArgs& args) override

  {

    auto source_bytes = args.source().bytes();

    m_sycl_stream->memcpy(args.destination().data(), source_bytes.data(),

                          source_bytes.size());

    if (!args.isAsync())

      this->barrier();

  }


  void prefetchMemory([[maybe_unused]] const MemoryPrefetchArgs& args) override

  {

    auto source_bytes = args.source().bytes();

    Int64 nb_byte = source_bytes.size();

    if (nb_byte == 0)

      return;

    m_sycl_stream->prefetch(source_bytes.data(), nb_byte);

    if (!args.isAsync())

      this->barrier();

  }


  Impl::NativeStream nativeStream() override

  {

    return Impl::NativeStream(m_sycl_stream.get());

  }


  void _setSyclLastCommandEvent([[maybe_unused]] void* sycl_event_ptr) override

  {

    sycl::event last_event;

    if (sycl_event_ptr)

      last_event = *(reinterpret_cast<sycl::event*>(sycl_event_ptr));

    m_last_command_event = last_event;

  }


 public:


  static sycl::async_handler _getAsyncHandler()

  {

    auto err_handler = [](const sycl::exception_list& exceptions) {

      std::ostringstream ostr;

      ostr << "Error in SYCL runtime\n";

      for (const std::exception_ptr& e : exceptions) {

        try {

          std::rethrow_exception(e);

        }

        catch (const sycl::exception& e) {

          ostr << "SYCL exception: " << e.what() << "\n";

        }

      }

      ARCCORE_FATAL(ostr.str());

    };

    return err_handler;

  }


  sycl::event lastCommandEvent() { return m_last_command_event; }


 public:


  sycl::queue& trueStream() const

  {

    return *m_sycl_stream;

  }


 private:


  impl::IRunnerRuntime* m_runtime;

  std::unique_ptr<sycl::queue> m_sycl_stream;

  sycl::event m_last_command_event;

};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


class SyclRunQueueEvent

: public impl::IRunQueueEventImpl

{

 public:


  explicit SyclRunQueueEvent([[maybe_unused]] bool has_timer)

  {

  }

  ~SyclRunQueueEvent() override

  {

  }


 public:


  // Enregistre l'événement au sein d'une RunQueue

  void recordQueue([[maybe_unused]] impl::IRunQueueStream* stream) final

  {

    ARCCORE_CHECK_POINTER(stream);

    auto* rq = static_cast<SyclRunQueueStream*>(stream);

    m_sycl_event = rq->lastCommandEvent();

#if defined(__ADAPTIVECPP__)

    m_recorded_stream = stream;

    // TODO: Vérifier s'il faut faire quelque chose

#elif defined(__INTEL_LLVM_COMPILER)

    //m_sycl_event = rq->trueStream().ext_oneapi_submit_barrier();

#else

    ARCCORE_THROW(NotSupportedException, "Only supported for AdaptiveCpp and Intel DPC++ implementation");

#endif

  }


  void wait() final

  {

    //ARCCORE_SYCL_FUNC_NOT_HANDLED;

    // TODO: Vérifier ce que cela signifie exactement

    m_sycl_event.wait();

  }


  void waitForEvent([[maybe_unused]] impl::IRunQueueStream* stream) final

  {

#if defined(__ADAPTIVECPP__)

    auto* rq = static_cast<SyclRunQueueStream*>(stream);

    m_sycl_event.wait(rq->trueStream().get_wait_list());

#elif defined(__INTEL_LLVM_COMPILER)

    std::vector<sycl::event> events;

    events.push_back(m_sycl_event);

    auto* rq = static_cast<SyclRunQueueStream*>(stream);

    rq->trueStream().ext_oneapi_submit_barrier(events);

#else

    ARCCORE_THROW(NotSupportedException, "Only supported for AdaptiveCpp and Intel DPC++ implementation");

#endif

  }


  Int64 elapsedTime([[maybe_unused]] IRunQueueEventImpl* start_event) final

  {

    ARCCORE_CHECK_POINTER(start_event);

    // Il faut prendre l'évènement de début car on est certain qu'il contient

    // la bonne valeur de 'sycl::event'.

    sycl::event event = (static_cast<SyclRunQueueEvent*>(start_event))->m_sycl_event;

    // Si pas d'évènement associé, on ne fait rien pour éviter une exception

    if (event==sycl::event())

      return 0;


    bool is_submitted = event.get_info<sycl::info::event::command_execution_status>() == sycl::info::event_command_status::complete;

    if (!is_submitted)

      return 0;

    Int64 start = event.get_profiling_info<sycl::info::event_profiling::command_start>();

    Int64 end = event.get_profiling_info<sycl::info::event_profiling::command_end>();

    return (end - start);

  }


  bool hasPendingWork() final

  {

    ARCCORE_THROW(NotImplementedException,"hasPendingWork()");

  }


 private:


  sycl::event m_sycl_event;

  impl::IRunQueueStream* m_recorded_stream = nullptr;

};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


class SyclRunnerRuntime

: public impl::IRunnerRuntime

{

  friend class SyclRunQueueStream;


 public:


  void notifyBeginLaunchKernel() override

  {

  }

  void notifyEndLaunchKernel() override

  {

  }

  void barrier() override

  {

    // TODO Faire le wait sur la file par défaut n'est pas strictement équivalent

    // à la barrière en CUDA qui synchronize tout le device.

    m_default_queue->wait();

  }

  eExecutionPolicy executionPolicy() const override

  {

    return eExecutionPolicy::SYCL;

  }

  impl::IRunQueueStream* createStream(const RunQueueBuildInfo& bi) override

  {

    return new SyclRunQueueStream(this, bi);

  }

  impl::IRunQueueEventImpl* createEventImpl() override

  {

    return new SyclRunQueueEvent(false);

  }

  impl::IRunQueueEventImpl* createEventImplWithTimer() override

  {

    return new SyclRunQueueEvent(true);

  }

  void setMemoryAdvice([[maybe_unused]] ConstMemoryView buffer, [[maybe_unused]] eMemoryAdvice advice,

                       [[maybe_unused]] DeviceId device_id) override

  {

  }

  void unsetMemoryAdvice([[maybe_unused]] ConstMemoryView buffer,

                         [[maybe_unused]] eMemoryAdvice advice, [[maybe_unused]] DeviceId device_id) override

  {

  }


  void setCurrentDevice([[maybe_unused]] DeviceId device_id) final

  {

    ARCCORE_SYCL_FUNC_NOT_HANDLED;

  }

  const IDeviceInfoList* deviceInfoList() override { return &m_device_info_list; }


  void getPointerAttribute(PointerAttribute& attribute, const void* ptr) override

  {

    sycl::usm::alloc sycl_mem_type = sycl::get_pointer_type(ptr, *m_default_context);

    ePointerMemoryType mem_type = ePointerMemoryType::Unregistered;

    const void* host_ptr = nullptr;

    const void* device_ptr = nullptr;

    if (sycl_mem_type == sycl::usm::alloc::host) {

      // HostPinned. Doit être accessible depuis le device mais

      //

      mem_type = ePointerMemoryType::Host;

      host_ptr = ptr;

      // TODO: Regarder comment récupérer la valeur

      device_ptr = ptr;

    }

    else if (sycl_mem_type == sycl::usm::alloc::device) {

      mem_type = ePointerMemoryType::Device;

      device_ptr = ptr;

    }

    else if (sycl_mem_type == sycl::usm::alloc::shared) {

      mem_type = ePointerMemoryType::Managed;

      // TODO: pour l'instant on remplit avec le pointeur car on ne sait

      // pas comment récupérer l'info.

      host_ptr = ptr;

      device_ptr = ptr;

    }

    // TODO: à corriger

    Int32 device_id = 0;

    _fillPointerAttribute(attribute, mem_type, device_id, ptr, device_ptr, host_ptr);

  }


  DeviceMemoryInfo getDeviceMemoryInfo([[maybe_unused]] DeviceId device_id) override

  {

    return {};

  }


  void fillDevicesAndSetDefaultQueue(bool is_verbose);

  sycl::queue& defaultQueue() const { return *m_default_queue; }

  sycl::device& defaultDevice() const { return *m_default_device; }


  void finalize(ITraceMng*) override

  {

    // Supprime la queue globale utilisée pour les allocations.

    global_default_queue = sycl::queue{};

  }


 private:


  impl::DeviceInfoList m_device_info_list;

  std::unique_ptr<sycl::device> m_default_device;

  std::unique_ptr<sycl::context> m_default_context;

  std::unique_ptr<sycl::queue> m_default_queue;


 private:


  void _init(sycl::device& device)

  {

    m_default_device = std::make_unique<sycl::device>(device);

    m_default_queue = std::make_unique<sycl::queue>(device);

    m_default_context = std::make_unique<sycl::context>(device);

  }

};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


SyclRunQueueStream::

SyclRunQueueStream(SyclRunnerRuntime* runtime, const RunQueueBuildInfo& bi)

: m_runtime(runtime)

{

  sycl::device& d = runtime->defaultDevice();

  // Indique que les commandes lancées sont implicitement exécutées les

  // unes derrière les autres.

  auto queue_property = sycl::property::queue::in_order();

  // Pour le profiling

  auto profiling_property = sycl::property::queue::enable_profiling();

  sycl::property_list queue_properties(queue_property, profiling_property);


  // Gestionnaire d'erreur.

  sycl::async_handler err_handler;

  err_handler = _getAsyncHandler();

  if (bi.isDefault())

    m_sycl_stream = std::make_unique<sycl::queue>(d, err_handler, queue_properties);

  else {

    ARCCORE_SYCL_FUNC_NOT_HANDLED;

    m_sycl_stream = std::make_unique<sycl::queue>(d, err_handler, queue_properties);

  }

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


void SyclRunnerRuntime::

fillDevicesAndSetDefaultQueue(bool is_verbose)

{

  if (is_verbose){

    for (auto platform : sycl::platform::get_platforms()) {

      std::cout << "Platform: "

                << platform.get_info<sycl::info::platform::name>()

                << std::endl;

    }

  }


  sycl::device device{ sycl::gpu_selector_v };

  if (is_verbose)

    std::cout << "\nDevice: " << device.get_info<sycl::info::device::name>()

              << "\nVersion=" << device.get_info<sycl::info::device::version>()

              << std::endl;

  // Pour l'instant, on prend comme file par défaut la première trouvée

  // et on ne considère qu'un seul device accessible.

  _init(device);


  DeviceInfo device_info;

  device_info.setDescription("No description info");

  device_info.setDeviceId(DeviceId(0));

  device_info.setName(device.get_info<sycl::info::device::name>());

  m_device_info_list.addDevice(device_info);

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


class SyclMemoryCopier

: public IMemoryCopier

{

  void copy(ConstMemoryView from, eMemoryResource from_mem,

            MutableMemoryView to, eMemoryResource to_mem,

            const RunQueue* queue) override;

};


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


} // namespace Arcane::Accelerator::Sycl


namespace

{

Arcane::Accelerator::Sycl::SyclRunnerRuntime global_sycl_runtime;

Arcane::Accelerator::Sycl::SyclMemoryCopier global_sycl_memory_copier;

} // namespace


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


namespace Arcane::Accelerator::Sycl

{


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


void SyclMemoryCopier::

copy(ConstMemoryView from, [[maybe_unused]] eMemoryResource from_mem,

     MutableMemoryView to, [[maybe_unused]] eMemoryResource to_mem,

     const RunQueue* queue)

{

  if (queue) {

    queue->copyMemory(MemoryCopyArgs(to.bytes(), from.bytes()).addAsync(queue->isAsync()));

    return;

  }

  sycl::queue& q = global_sycl_runtime.defaultQueue();

  q.memcpy(to.data(), from.data(), from.bytes().size()).wait();

}


} // namespace Arcane::Accelerator::Sycl


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/


// Cette fonction est le point d'entrée utilisé lors du chargement

// dynamique de cette bibliothèque

extern "C" ARCCORE_EXPORT void

arcaneRegisterAcceleratorRuntimesycl(Arcane::Accelerator::RegisterRuntimeInfo& init_info)

{

  using namespace Arcane;

  using namespace Arcane::Accelerator::Sycl;

  Arcane::Accelerator::impl::setUsingSYCLRuntime(true);

  Arcane::Accelerator::impl::setSYCLRunQueueRuntime(&global_sycl_runtime);

  MemoryUtils::setAcceleratorHostMemoryAllocator(&unified_memory_sycl_memory_allocator);

  MemoryUtils::setDefaultDataMemoryResource(eMemoryResource::UnifiedMemory);

  IMemoryResourceMngInternal* mrm = MemoryUtils::getDataMemoryResourceMng()->_internal();

  mrm->setIsAccelerator(true);

  mrm->setAllocator(eMemoryResource::UnifiedMemory, &unified_memory_sycl_memory_allocator);

  mrm->setAllocator(eMemoryResource::HostPinned, &host_pinned_sycl_memory_allocator);

  mrm->setAllocator(eMemoryResource::Device, &device_sycl_memory_allocator);

  mrm->setCopier(&global_sycl_memory_copier);

  global_sycl_runtime.fillDevicesAndSetDefaultQueue(init_info.isVerbose());

  global_default_queue = global_sycl_runtime.defaultQueue();

}


/*---------------------------------------------------------------------------*/

/*---------------------------------------------------------------------------*/

ARCCORE_FATAL
#define ARCCORE_FATAL(...)
Macro envoyant une exception FatalErrorException.
Definition ArccoreGlobal.h:532

ARCCORE_THROW
#define ARCCORE_THROW(exception_class,...)
Macro pour envoyer une exception avec formattage.
Definition ArccoreGlobal.h:508

ARCCORE_CHECK_POINTER
#define ARCCORE_CHECK_POINTER(ptr)
Macro retournant le pointeur ptr s'il est non nul ou lancant une exception s'il est nul.
Definition ArccoreGlobal.h:763

Arcane::Accelerator::DeviceId
Identifiant d'un composant du système.
Definition arccore/src/common/arccore/common/accelerator/DeviceId.h:33

Arcane::Accelerator::DeviceMemoryInfo
Information mémoire d'un accélérateur.
Definition arccore/src/common/arccore/common/accelerator/DeviceMemoryInfo.h:31

Arcane::Accelerator::IDeviceInfoList
Interface d'une liste de devices.
Definition arccore/src/common/arccore/common/accelerator/IDeviceInfoList.h:31

Arcane::Accelerator::Impl::NativeStream
Type opaque pour encapsuler une 'stream' native.
Definition arccore/src/common/arccore/common/accelerator/NativeStream.h:54

Arcane::Accelerator::MemoryCopyArgs
Arguments pour la copie mémoire.
Definition arccore/src/common/arccore/common/accelerator/Memory.h:61

Arcane::Accelerator::MemoryPrefetchArgs
Arguments pour le préfetching mémoire.
Definition arccore/src/common/arccore/common/accelerator/Memory.h:123

Arcane::Accelerator::PointerAttribute
Informations sur une adresse mémoire.
Definition arccore/src/common/arccore/common/accelerator/PointerAttribute.h:36

Arcane::Accelerator::RegisterRuntimeInfo
Informations pour initialiser le runtime accélérateur.
Definition RegisterRuntimeInfo.h:31

Arcane::Accelerator::RunQueueBuildInfo
Informations pour créer une RunQueue.
Definition arccore/src/common/arccore/common/accelerator/RunQueueBuildInfo.h:31

Arcane::Accelerator::RunQueueBuildInfo::isDefault
bool isDefault() const
Indique si l'instance a uniquement les valeurs par défaut.
Definition arccore/src/common/arccore/common/accelerator/RunQueueBuildInfo.h:53

Arcane::Accelerator::RunQueue
File d'exécution pour un accélérateur.
Definition arccore/src/common/arccore/common/accelerator/RunQueue.h:52

Arcane::Accelerator::RunQueue::isAsync
bool isAsync() const
Indique si la file d'exécution est asynchrone.
Definition RunQueue.cc:320

Arcane::Accelerator::RunQueue::copyMemory
void copyMemory(const MemoryCopyArgs &args) const
Copie des informations entre deux zones mémoires.
Definition RunQueue.cc:237

Arcane::Accelerator::Sycl::DeviceSyclMemoryAllocator
Definition SyclAcceleratorRuntime.cc:156

Arcane::Accelerator::Sycl::DeviceSyclMemoryAllocator::memoryResource
eMemoryResource memoryResource() const override
Ressource mémoire fournie par l'allocateur.
Definition SyclAcceleratorRuntime.cc:167

Arcane::Accelerator::Sycl::HostPinnedSyclMemoryAllocator
Definition SyclAcceleratorRuntime.cc:136

Arcane::Accelerator::Sycl::HostPinnedSyclMemoryAllocator::memoryResource
eMemoryResource memoryResource() const override
Ressource mémoire fournie par l'allocateur.
Definition SyclAcceleratorRuntime.cc:148

Arcane::Accelerator::Sycl::SyclMemoryAllocatorBase::hasRealloc
bool hasRealloc(MemoryAllocationArgs) const override
Indique si l'allocateur supporte la sémantique de realloc.
Definition SyclAcceleratorRuntime.cc:75

Arcane::Accelerator::Sycl::SyclMemoryAllocatorBase::reallocate
AllocatedMemoryInfo reallocate(MemoryAllocationArgs args, AllocatedMemoryInfo current_ptr, Int64 new_size) override
Réalloue de la mémoire pour new_size octets et retourne le pointeur.
Definition SyclAcceleratorRuntime.cc:88

Arcane::Accelerator::Sycl::SyclMemoryAllocatorBase::allocate
AllocatedMemoryInfo allocate(MemoryAllocationArgs args, Int64 new_size) override
Definition SyclAcceleratorRuntime.cc:76

Arcane::Accelerator::Sycl::SyclMemoryAllocatorBase::deallocate
void deallocate(MemoryAllocationArgs args, AllocatedMemoryInfo ptr) override
Libère la mémoire dont l'adresse de base est ptr.
Definition SyclAcceleratorRuntime.cc:100

Arcane::Accelerator::Sycl::SyclMemoryCopier
Definition SyclAcceleratorRuntime.cc:540

Arcane::Accelerator::Sycl::SyclMemoryCopier::copy
void copy(ConstMemoryView from, eMemoryResource from_mem, MutableMemoryView to, eMemoryResource to_mem, const RunQueue *queue) override
Copie les données de from vers to avec la queue queue.
Definition SyclAcceleratorRuntime.cc:567

Arcane::Accelerator::Sycl::SyclRunQueueEvent
Definition SyclAcceleratorRuntime.cc:285

Arcane::Accelerator::Sycl::SyclRunQueueStream
Definition SyclAcceleratorRuntime.cc:185

Arcane::Accelerator::Sycl::SyclRunQueueStream::barrier
void barrier() override
Bloque jusqu'à ce que toutes les actions associées à cette file soient terminées.
Definition SyclAcceleratorRuntime.cc:203

Arcane::Accelerator::Sycl::SyclRunQueueStream::lastCommandEvent
sycl::event lastCommandEvent()
Évènement correspondant à la dernière commande.
Definition SyclAcceleratorRuntime.cc:264

Arcane::Accelerator::Sycl::SyclRunQueueStream::prefetchMemory
void prefetchMemory(const MemoryPrefetchArgs &args) override
Effectue un pré-chargement d'une zone mémoire.
Definition SyclAcceleratorRuntime.cc:220

Arcane::Accelerator::Sycl::SyclRunQueueStream::nativeStream
Impl::NativeStream nativeStream() override
Pointeur sur la structure interne dépendante de l'implémentation.
Definition SyclAcceleratorRuntime.cc:230

Arcane::Accelerator::Sycl::SyclRunQueueStream::copyMemory
void copyMemory(const MemoryCopyArgs &args) override
Effectue une copie entre deux zones mémoire.
Definition SyclAcceleratorRuntime.cc:212

Arcane::Accelerator::Sycl::SyclRunQueueStream::_barrierNoException
bool _barrierNoException() override
Barrière sans exception. Retourne true en cas d'erreur.
Definition SyclAcceleratorRuntime.cc:207

Arcane::Accelerator::Sycl::SyclRunQueueStream::_setSyclLastCommandEvent
void _setSyclLastCommandEvent(void *sycl_event_ptr) override
Pour SYCL, positionne l'évènement associé à la dernière commande exécutée.
Definition SyclAcceleratorRuntime.cc:235

Arcane::Accelerator::Sycl::SyclRunQueueStream::notifyEndLaunchKernel
void notifyEndLaunchKernel(impl::RunCommandImpl &) override
Notification de fin de lancement de la commande.
Definition SyclAcceleratorRuntime.cc:199

Arcane::Accelerator::Sycl::SyclRunQueueStream::notifyBeginLaunchKernel
void notifyBeginLaunchKernel(impl::RunCommandImpl &c) override
Notification avant le lancement de la commande.
Definition SyclAcceleratorRuntime.cc:195

Arcane::Accelerator::Sycl::SyclRunnerRuntime
Definition SyclAcceleratorRuntime.cc:369

Arcane::Accelerator::Sycl::UnifiedMemorySyclMemoryAllocator
Definition SyclAcceleratorRuntime.cc:117

Arcane::Accelerator::Sycl::UnifiedMemorySyclMemoryAllocator::memoryResource
eMemoryResource memoryResource() const override
Ressource mémoire fournie par l'allocateur.
Definition SyclAcceleratorRuntime.cc:128

Arcane::Accelerator::impl::DeviceInfoList
Interface d'une liste de devices.
Definition arccore/src/common/arccore/common/accelerator/DeviceInfoList.h:35

Arcane::Accelerator::impl::IRunQueueEventImpl
Interface de l'implémentation d'un évènement.
Definition IRunQueueEventImpl.h:32

Arcane::Accelerator::impl::IRunQueueStream
Interface d'un flux d'exécution pour une RunQueue.
Definition IRunQueueStream.h:32

Arcane::Accelerator::impl::IRunnerRuntime
Interface du runtime associé à un accélérateur.
Definition IRunnerRuntime.h:35

Arcane::Accelerator::impl::RunCommandImpl
Implémentation d'une commande pour accélérateur.
Definition arccore/src/common/arccore/common/accelerator/internal/RunCommandImpl.h:40

Arcane::AllocatedMemoryInfo
Informations sur une zone mémoire allouée.
Definition AllocatedMemoryInfo.h:31

Arcane::AllocatedMemoryInfo::baseAddress
void * baseAddress() const
Adresse du début de la zone allouée.
Definition AllocatedMemoryInfo.h:50

Arcane::AllocatedMemoryInfo::size
Int64 size() const
Taille en octets de la zone mémoire utilisée. (-1) si inconnue.
Definition AllocatedMemoryInfo.h:52

Arcane::ConstMemoryView
Vue constante sur une zone mémoire contigue contenant des éléments de taille fixe.
Definition arccore/src/base/arccore/base/MemoryView.h:38

Arcane::ConstMemoryView::bytes
constexpr SpanType bytes() const
Vue sous forme d'octets.
Definition arccore/src/base/arccore/base/MemoryView.h:107

Arcane::ConstMemoryView::data
constexpr const std::byte * data() const
Pointeur sur la zone mémoire.
Definition arccore/src/base/arccore/base/MemoryView.h:110

Arcane::IMemoryCopier
Interface pour les copies mémoire avec support des accélérateurs.
Definition IMemoryCopier.h:32

Arcane::IMemoryResourceMngInternal
Partie interne à Arcane de 'IMemoryRessourceMng'.
Definition IMemoryResourceMngInternal.h:31

Arcane::IMemoryResourceMngInternal::setAllocator
virtual void setAllocator(eMemoryResource r, IMemoryAllocator *allocator)=0
Positionne l'allocateur pour la ressource r.

Arcane::IMemoryResourceMngInternal::setIsAccelerator
virtual void setIsAccelerator(bool v)=0
Indique si un accélérateur est disponible.

Arcane::IMemoryResourceMngInternal::setCopier
virtual void setCopier(IMemoryCopier *copier)=0
Positionne l'instance gérant les copies.

Arcane::IMemoryResourceMng::_internal
virtual IMemoryResourceMngInternal * _internal()=0
Interface interne.

Arcane::ITraceMng
Interface du gestionnaire de traces.
Definition arccore/src/trace/arccore/trace/ITraceMng.h:156

Arcane::MemoryAllocationArgs
Classe contenant des informations pour spécialiser les allocations.
Definition common/arccore/common/MemoryAllocationArgs.h:31

Arcane::MutableMemoryView
Vue modifiable sur une zone mémoire contigue contenant des éléments de taille fixe.
Definition arccore/src/base/arccore/base/MemoryView.h:156

Arcane::MutableMemoryView::data
constexpr std::byte * data() const
Pointeur sur la zone mémoire.
Definition arccore/src/base/arccore/base/MemoryView.h:218

Arcane::MutableMemoryView::bytes
constexpr SpanType bytes() const
Vue sous forme d'octets.
Definition arccore/src/base/arccore/base/MemoryView.h:215

Arcane::NotImplementedException
Exception lorsqu'une fonction n'est pas implémentée.
Definition arccore/src/base/arccore/base/NotImplementedException.h:33

Arcane::NotSupportedException
Exception lorsqu'une opération n'est pas supportée.
Definition arccore/src/base/arccore/base/NotSupportedException.h:33

Arcane::SpanImpl::size
constexpr __host__ __device__ SizeType size() const noexcept
Retourne la taille du tableau.
Definition Span.h:325

Arcane::Accelerator::eMemoryAdvice
eMemoryAdvice
Conseils pour la gestion mémoire.
Definition arccore/src/common/arccore/common/accelerator/Memory.h:34

Arcane::Accelerator::ePointerMemoryType
ePointerMemoryType
Type de mémoire pour un pointeur.
Definition CommonAcceleratorGlobal.h:155

Arcane::Accelerator::eExecutionPolicy
eExecutionPolicy
Politique d'exécution pour un Runner.
Definition CommonAcceleratorGlobal.h:92

Arcane::Accelerator::eExecutionPolicy::SYCL
@ SYCL
Politique d'exécution utilisant l'environnement SYCL.
Definition CommonAcceleratorGlobal.h:104

Arcane::MemoryUtils::getDataMemoryResourceMng
ARCCORE_COMMON_EXPORT IMemoryRessourceMng * getDataMemoryResourceMng()
Gestionnaire de ressource mémoire pour les données.
Definition arccore/src/common/arccore/common/MemoryUtils.cc:128

Arcane::MemoryUtils::setAcceleratorHostMemoryAllocator
ARCCORE_COMMON_EXPORT IMemoryAllocator * setAcceleratorHostMemoryAllocator(IMemoryAllocator *a)
Positionne l'allocateur spécifique pour les accélérateurs.
Definition arccore/src/common/arccore/common/MemoryUtils.cc:149

Arcane::MemoryUtils::setDefaultDataMemoryResource
ARCCORE_COMMON_EXPORT void setDefaultDataMemoryResource(eMemoryResource mem_resource)
Positionne la ressource mémoire utilisée pour l'allocateur mémoire des données.
Definition arccore/src/common/arccore/common/MemoryUtils.cc:107

Arcane::platform
Espace de nom pour les fonctions dépendant de la plateforme.
Definition arcane/src/arcane/utils/PlatformUtils.cc:101

Arcane
-*- tab-width: 2; indent-tabs-mode: nil; coding: utf-8-with-signature -*-
Definition arcane/src/arcane/accelerator/AcceleratorGlobal.h:37

Arcane::Int64
std::int64_t Int64
Type entier signé sur 64 bits.
Definition ArccoreGlobal.h:227

Arcane::eMemoryResource
eMemoryResource
Liste des ressources mémoire disponibles.
Definition CommonGlobal.h:161

Arcane::eMemoryResource::HostPinned
@ HostPinned
Alloue sur l'hôte.
Definition CommonGlobal.h:167

Arcane::eMemoryResource::UnifiedMemory
@ UnifiedMemory
Alloue en utilisant la mémoire unifiée.
Definition CommonGlobal.h:171

Arcane::eMemoryResource::Device
@ Device
Alloue sur le device.
Definition CommonGlobal.h:169

Arcane::Int32
std::int32_t Int32
Type entier signé sur 32 bits.
Definition ArccoreGlobal.h:225