ExecuTorch 运行时 API 参考¶
ExecuTorch C++ API 为导出的 PyTorch 模型提供了设备端执行框架。
有关运行时 API 的教程样式介绍,请查看运行时教程及其简化版本。
有关 API 如何发展和弃用过程的详细信息,请参阅 ExecuTorch API 生命周期和弃用策略。
模型加载和执行¶
-
类程序¶
反序列化的 ExecuTorch 程序二进制文件。
公共类型
公共函数
-
结果<const void*> get_constant_buffer_data(size_t buffer_idx, size_t nbytes) const¶
获取 Program 中索引为 buffer_idx的常量缓冲区。
- 参数
buffer_idx – [in] 缓冲区在 constant_buffer 中的索引。
nbytes – [in] 要从缓冲区读取的字节数。
- 返回
具有相应索引的缓冲区。
-
size_t num_methods() const¶
返回程序中方法的数目。
-
结果<const char*> get_method_name(size_t method_index) const¶
返回特定索引处的方法名称。
- 参数
method_index – [in] 要检索的方法名称的索引。必须小于 返回的值。
num_methods()
- 返回
-
结果<方法> load_method(const char *method_name, MemoryManager *memory_manager,EventTracer *event_tracer = nullptr) const¶
加载命名方法并准备执行。
- 参数
method_name – [in] 要加载的方法的名称。
memory_manager – [in] 在初始化和执行 loaded 方法期间使用的分配器。如果为 null,则运行时将使用 分配临时内存。
memory_manager.temp_allocator()
et_pal_allocate()
event_tracer – [in] 用于此方法运行的事件跟踪器。
- 返回
成功时加载的方法,失败时出错。
-
结果<MethodMeta> method_meta(const char *method_name) const¶
收集命名方法的元数据。
- 参数
method_name – [in] 要获取元数据的方法的名称。
- ET_DEPRECATED 结果< const char * > get_output_flattening_encoding (const char *method_name=“forward”) const
已弃用:获取输出的 pytree 编码字符串。已弃用,因为此功能最终会从核心程序中移动到更高级别的结构中,但目前不存在。
- 参数
method_name – [in] 要获取其编码的方法的名称。
- 返回
输出的 pytree 编码字符串
公共静态函数
- static ET_NODISCARD Result< 程序>加载 (DataLoader *loader, Verification verification=Verification::Minimal)
从提供的加载程序加载程序。Program 将保存一个指向 loader 的指针,该指针必须比返回的 Program 实例长。
- 静态内联ET_DEPRECATED ET_NODISCARD Result< 程序>加载 (DataLoader *loader, Verification verification=Verification::Minimal)
DEPRECATED: 请改用小写字母。
load()
-
static HeaderStatus check_header(const void *data, size_t 大小)¶
在提供的数据中查找 ExecuTorch 程序头文件。
- 参数
data – [in] 可能包含 ExecuTorch 程序的文件开头的数据。
size – [in] 的大小(以字节为单位)。必须为 >= 。
data
kMinHeadBytes
- 返回
描述数据中存在标头的值。
公共静态属性
-
static constexpr size_t kMinHeadBytes = 64¶
调用 .
check_header
-
结果<const void*> get_constant_buffer_data(size_t buffer_idx, size_t nbytes) const¶
-
class 方法¶
executorch 程序的可执行方法。映射到 python 方法,如原始 nn.模块。
forward()
公共函数
- ET_NODISCARD Error set_input (const EValue &input_evalue, size_t input_idx)
将内部输入值设置为等效于提供的值。
- 参数
input_evalue – [in] 要复制到方法输入中的 evalue。如果 evalue 是一个张量,则在大多数情况下都会复制数据,因此此处传入的张量并不总是需要比此调用长寿。但是在某些情况下,Method 将保留指向张量数据的指针。根据方法的内存计划,输入可能没有预先为其分配缓冲区空间。在这种情况下,执行程序将在此处作为输入提供的张量的内存别名,而不是将输入深度复制到内存计划的竞技场中。
input_idx – [in] 要设置的输入的从零开始的索引。必须小于 inputs_size() 返回的值。
- 返回
Error::Ok 表示成功,失败时为 non-Ok。
- ET_NODISCARD 错误 set_inputs (const executorch::aten::ArrayRef< EValue > &input_evalues)
设置所有方法输入的值。
有关行为的更详细描述,请参阅 set_input() 。
- 参数
input_evalues – [in] 所有方法输入的新值。每个元素的类型必须与相应输入的类型匹配。如果元素的值是张量,则尝试允许动态形状,但 dtype 必须始终一致。
- 返回
Error::Ok 表示成功,失败时为 non-Ok。
- ET_NODISCARD 错误set_output_data_ptr (void *buffer、size_t size、size_t output_idx)
将指定方法输出的数据缓冲区设置为提供的值。
注意:根据该方法的内存计划,输出张量可能没有预先为其分配缓冲区空间,在这种情况下,执行程序会将这些张量指向此处提供的缓冲区,因此用户应注意此内存的寿命比执行程序的寿命更长。
- 参数
buffer – [in] 要将指定张量指向的内存块。
size – [in] 缓冲区的长度(以字节为单位),必须>= 指定张量的 nbytes。
output_idx – [in] 要为其设置data_ptr的输出的索引。必须对应于一个 tensor,并且该 tensor 必须没有由 memory plan 分配的缓冲区。
- 返回
Error::Ok 表示成功,失败时为 non-Ok。
- ET_NODISCARD 误差get_outputs (EValue *output_evalues, size_t length)
将方法的输出复制到提供的数组中。
警告:输出包含内部张量输出的浅表副本。请不要更改返回的 Tensor 元素。
TODO(T139259264):添加检查以检测输出更改或深拷贝输出。
- 参数
output_evalues – [in] 要将输出复制到的数组。第一个元素将设置为相应的输出值。数组的其余部分将设置为 EValue 值 None。
outputs_size()
length – [in] 数组的大小(以元素为单位)。必须大于或等于 。
output_evalues
outputs_size()
- 返回
Error::Ok 表示成功,失败时为 non-Ok。
- ET_NODISCARD 误差get_inputs (EValue *input_evalues, size_t length)
将方法的输入复制到提供的数组中。
警告: input 包含内部 Tensor Inputs 的浅表副本。请不要更改返回的 Tensor 元素。
- 参数
input_evalues – [in] 要将输入复制到的数组。第一个元素将设置为相应的 input 值。数组的其余部分将设置为 EValue 值 None。
inputs_size()
length – [in] 数组的大小(以元素为单位)。必须大于或等于 。
input_evalues
inputs_size()
- 返回
Error::Ok 表示成功,失败时为 non-Ok。
- ET_NODISCARD 错误执行 ()
执行该方法。
注意:如果该方法已使用 API 部分执行,则将失败。
step()
- 返回
Error::Ok 表示成功,失败时为 non-Ok。
- ET_EXPERIMENTAL ET_NODISCARD 错误步骤 ()
实验性:推进/执行方法中的单个指令。
- 返回值
Error::Ok – 步骤成功
non-Ok – 步骤失败
Error::EndOfMethod – 方法成功完成执行
- ET_DEPRECATED ET_NODISCARD 错误 experimental_step ()
已弃用:请改用。
step()
- ET_EXPERIMENTAL ET_NODISCARD 错误 reset_execution ()
实验性:将执行状态重置为 Method 的开头。用于 API。
step()
- 返回值
错误:正常 – 成功
Error::InvalidState – 如果在基于步骤的执行到达 Method 末尾之前调用。这意味着无法恢复在执行过程中失败的方法。
- ET_DEPRECATED ET_NODISCARD 错误 experimental_reset_execution ()
已弃用:请改用。
reset_execution()
-
MethodMeta method_meta() const¶
返回与调用 Method 对应的 MethodMeta。
- ET_DEPRECATED const EValue & get_input (size_t i) const
已弃用:改用 MethodMeta 访问元数据,并使用 set_input 更新 Method 输入。
- ET_DEPRECATED EValue & mutable_input (size_t i)
已弃用:改用 MethodMeta 访问元数据,并使用 set_input 更新 Method 输入。
- ET_DEPRECATED EValue & mutable_output (size_t i)
已弃用:改用 MethodMeta 访问元数据,并使用 get_output 检索 Method 输出。
-
类 MethodMeta¶
描述 ExecuTorch 程序中的方法。
用于创建 MethodMeta 对象的程序必须比 MethodMeta 长。它与 Method 是分开的,因此可以访问此信息,而无需支付加载完整 Method 的初始化成本。
公共函数
-
const char *name() const¶
获取此方法的名称。
- 返回
方法名称。
-
size_t num_inputs() const¶
获取此方法的输入数。
- 返回
输入的数量。
-
结果<Tag> input_tag(size_t index) const¶
获取指定输入的标签。
- 参数
index – [in] 要查找的输入的索引。
- 返回
input 的 tag 只能是 [Tensor, Int, Bool, Double, String]。
-
结果<TensorInfo> input_tensor_meta(size_t index) const¶
获取有关指定输入的元数据。
- 参数
index – [in] 要查找的输入的索引。
- 返回
成功时的元数据,或失败时的错误。仅对 tag::Tensor 有效
-
size_t num_outputs() const¶
获取此方法的输出数。
- 返回
输出的数量。
-
结果<标签> output_tag(size_t 索引) const¶
获取指定输出的 tag。
- 参数
index – [in] 要查找的输出的索引。
- 返回
output 的 tag 只能是 [Tensor, Int, Bool, Double, String]。
-
结果<TensorInfo> output_tensor_meta(size_t index) const¶
获取有关指定输出的元数据。
- 参数
index – [in] 要查找的输出的索引。
- 返回
成功时的元数据,或失败时的错误。仅对 tag::Tensor 有效
-
size_t num_memory_planned_buffers() const¶
获取此方法所需的内存计划缓冲区数。
- 返回
内存计划缓冲区的数量。
-
结果<int64_t> memory_planned_buffer_size(size_t index) const¶
获取指定内存计划缓冲区的大小(以字节为单位)。
- 参数
index – [in] 要查找的缓冲区的索引。
- 返回
成功时的大小(以字节为单位),失败时为错误。
- ET_EXPERIMENTAL size_t num_instructions () const
获取此方法中的指令数。
- 返回
指令的数量。
- 内联 ET_DEPRECATED size_t num_non_const_buffers () const
已弃用:请改用 num_memory_planned_buffers()。
-
inline Result<int64_t> non_const_buffer_size(size_t index) const¶
已弃用: 请改用 memory_planned_buffer_size()。
-
const char *name() const¶
-
类 DataLoader¶
从数据源加载。
有关常见实现,请参阅 //executorch/extension/data_loader。
公共函数
- 虚拟ET_NODISCARD结果<FreeableBuffer > 加载(size_t 偏移量、size_t大小、const SegmentInfo &segment_info) const =0
从基础数据源加载数据。
注意:这必须是线程安全的。如果此调用修改了公共状态,则实现必须执行自己的锁定。
- 参数
offset – 数据源中要从中开始加载的字节偏移量。
size – 要加载的字节数。
segment_info – 有关正在加载的分段的信息。
- 返回
a 拥有加载的数据。
FreeableBuffer
- 内联虚拟ET_NODISCARD错误 load_into (size_t offset, size_t size, const SegmentInfo &segment_info, void *buffer) const
将数据从基础数据源加载到提供的缓冲区中。
注意:这必须是线程安全的。如果此调用修改了公共状态,则实现必须执行自己的锁定。
- 参数
offset – 数据源中要从中开始加载的字节偏移量。
size – 要加载的字节数。
segment_info – 有关正在加载的分段的信息。
buffer – 要将数据加载到其中的缓冲区。必须至少指向字节的内存。
size
- 返回
指示加载是否成功的 Error 。
- 虚拟ET_NODISCARD结果<size_t > 大小 () const =0
返回基础数据源的长度,通常为文件大小。
-
类 MemoryAllocator¶
一个基于大小执行简单分配并返回指向内存地址的指针的类。它将具有特定大小的缓冲区添加书签。分配只是检查空间并随每个分配请求增加 cur_ 指针。
简单示例:
用户在堆中分配 100 字节长的内存。uint8_t* memory_pool = malloc(100 * sizeof(uint8_t));MemoryAllocator allocator(100, memory_pool) // 在 Executor 中传递分配器对象
在后台,ExecuTorch 将调用 allocator.allocate() 来继续迭代cur_指针
由 executorch::runtime::internal::P latformMemoryAllocator 子类化
公共函数
-
inline MemoryAllocator(uint32_t 大小,uint8_t *base_address)¶
构造给定 的新内存分配器 ,从提供的 .
size
base_address
- 参数
size – [in] 缓冲区的大小(以字节为单位)。
base_address
base_address – [in] 要从中分配的缓冲区。不获取此缓冲区的所有权,因此它必须在 MemoryAllocator 的生存期内有效。
-
内联虚拟 void *allocate(size_t 大小,size_t对齐 = kDefaultAlignment)¶
分配内存字节数。
size
- 参数
size – [in] 要分配的字节数。
alignment – [in] 返回的指针的最小对齐方式。必须是 2 的幂。
- 返回值
nullptr – 内存不足,或者不是 2 的幂。
alignment
- 返回
成功时将指针对齐到分配的内存。
公共静态属性
-
static constexpr size_t kDefaultAlignment = alignof(void*)¶
此类返回的内存的默认对齐方式。确保结构体的指针字段将对齐。但是,较大的类型(如)可能不是,具体取决于工具链和架构。
long double
-
inline MemoryAllocator(uint32_t 大小,uint8_t *base_address)¶
-
类 HierarchicalAllocator¶
一组可用于表示设备内存层次结构的缓冲区。
公共函数
-
内联显式 HierarchicalAllocator(Span<Span<uint8_t>> 缓冲区)¶
使用给定的缓冲区数组构造一个新的分层分配器。
内存 ID 基于索引 into : 将具有内存 ID 。
buffers
buffers[N]
N
buffers.size()
必须为 >= 。MethodMeta::num_non_const_buffers()
buffers[N].size()
必须为 >= 。MethodMeta::non_const_buffer_size(N)
-
inline ET_DEPRECATED HierarchicalAllocator(uint32_t n_allocators, MemoryAllocator *allocators)¶
已弃用:请改用 span。
- 内联 ET_NODISCARD 结果< void * > get_offset_address (uint32_t memory_id、size_t offset_bytes、size_t size_bytes)
返回与给定缓冲区的基址的字节偏移量处的地址,该地址至少指向内存。
offset_bytes
size_bytes
- 参数
memory_id – [in] 层次结构中缓冲区的 ID。
offset_bytes – [in] 指定缓冲区的偏移量(以字节为单位)。
size_bytes – [in] 偏移量应可用的内存量。
- 返回
成功后,请求的字节偏移量的地址将进入指定的缓冲区。失败时,非 Ok 错误。
-
内联显式 HierarchicalAllocator(Span<Span<uint8_t>> 缓冲区)¶
-
类 MemoryManager¶
在 Method 加载和执行期间使用的分配器的容器类。
此类整合了 Method 加载和执行的所有动态内存需求。这可以允许基于堆和无堆的执行(与某些嵌入式场景相关),并且总体上提供了对内存使用的更多控制。
但是,此类无法确保所有分配都被考虑在内,因为 kernel 和 backend implementations可以自由使用单独的方式来分配内存(例如,对于暂存空间之类的东西)。但我们确实建议后端和内核尽可能使用这些提供的分配器。
公共函数
-
内联显式 MemoryManager(MemoryAllocator *method_allocator, HierarchicalAllocator *planned_memory = nullptr,MemoryAllocator *temp_allocator = nullptr)¶
构造新的 MemoryManager。
- 参数
method_allocator – [in] 加载 Method 并分配其内部结构时使用的分配器。必须比使用它的 Method 活得更久。
planned_memory – [in] 执行 Method 时用于可变张量数据的内存计划缓冲区。必须比使用它的 Method 活得更久。如果 Method 不使用任何内存计划的张量数据,则可能是。此 HierarchicalAllocator 中缓冲区的大小必须与嵌入在 Program 中的相应 and 值一致。
nullptr
MethodMeta::num_memory_planned_buffers()
MethodMeta::memory_planned_buffer_size(N)
temp_allocator – [in] 在内核或委托执行期间分配临时数据时使用的分配器。必须比使用它的 Method 活得更久。如果 Method 不使用分配临时数据的内核或委托,则可能是这样。在执行期间,此分配器将在每次内核或 delegate 调用后重置。
nullptr
-
内联 ET_DEPRECATED MemoryManager(MemoryAllocator *constant_allocator、HierarchicalAllocator *non_constant_allocator、MemoryAllocator *runtime_allocator,MemoryAllocator *temporary_allocator)¶
已弃用:使用 constructor without instead。
constant_allocator
TODO(T162089316):在所有用户迁移到新 ctor 后删除此项。
-
内联 MemoryAllocator *method_allocator() const¶
-
内联 HierarchicalAllocator *planned_memory() const¶
返回用于可变张量数据的内存计划缓冲区。
-
内联 MemoryAllocator *temp_allocator() const¶
返回用于在内核或 delegate 执行期间分配临时数据的分配器。
在执行期间,此分配器将在每次内核或 delegate 调用后重置。
-
内联显式 MemoryManager(MemoryAllocator *method_allocator, HierarchicalAllocator *planned_memory = nullptr,MemoryAllocator *temp_allocator = nullptr)¶
值¶
-
struct EValue¶
公共函数
-
类 Tensor¶
一个最小的 Tensor 类型,其 API 是 at::Tensor 的源兼容子集。
注意:此类的实例不拥有给定给它的 TensorImpl,这意味着调用方必须保证 TensorImpl 的生存期比指向它的任何 Tensor 实例长。
有关此处使用的 return/parameter 类型以及它们与 at::Tensor 的关系的详细信息,请参阅有关 TensorImpl 的文档。
公共类型
-
使用 DimOrderType = TensorImpl::DimOrderType¶
用于 的元素的类型。
dim_order()
公共函数
-
内联 TensorImpl *unsafeGetTensorImpl() const¶
返回指向底层 TensorImpl 的指针。
注意:客户端应警惕直接在 TensorImpl 上操作,而不是在 Tensor 上操作。破坏东西很容易。
-
内联 size_t nbytes() const¶
返回张量的大小(以字节为单位)。
注意:仅返回活动空间,而不返回基础数据 blob 的总容量。
-
内联 ssize_t size(ssize_t dim) const¶
返回给定维度的张量大小。
注意:size() 故意不返回 SizeType,即使它返回 SizeType 数组的元素。这是为了帮助使此方法的调用与 at::Tensor 更兼容,并与此类和 ETensor 中的其余方法更加一致。
-
内联 ssize_t dim() const¶
返回张量的维度数。
-
内联 ssize_t numel() const¶
返回张量中的元素数。
-
内联 ScalarType scalar_type() const ¶
返回张量中元素的类型(int32、float、bool 等)。
-
内联 ssize_t element_size() const ¶
返回张量的一个元素的大小(以字节为单位)。
-
内联 const ArrayRef<DimOrderType> dim_order() ) const¶
返回维度在内存中的布局顺序。
-
内联 const ArrayRef<StridesType> strides() const¶
返回张量在每个维度上的步幅。
-
内联 TensorShapeDynamism shape_dynamism() const¶
返回张量形状的可变性。
-
内联 const void *const_data_ptr() const¶
返回指向常量基础数据 blob 的指针。
-
内联 void *mutable_data_ptr() const¶
返回指向可变基础数据 blob 的指针。
- template<typename T> 内联 ET_DEPRECATED T * data_ptr () const
已弃用:请改用 const_data_ptr 或 mutable_data_ptr。
- 内联 ET_DEPRECATED void * data_ptr () const
已弃用:请改用 const_data_ptr 或 mutable_data_ptr。
- 内联 ET_DEPRECATED void set_data (void *ptr) const
DEPRECATED:更改张量别名data_ptr。不释放以前指向的数据,不假定新 ptr 的所有权语义。at::Tensor 中不存在此 api,因此内核开发人员应避免使用它。
-
使用 DimOrderType = TensorImpl::DimOrderType¶