目录

自动微分包 - torch.autograd

torch.autograd提供实现任意标量值函数自动微分的类和函数。

它只需要对现有代码进行最少的更改 - 你只需要声明 s 对于哪些梯度,应该使用关键字计算。 截至目前,我们只支持浮点类型 ( half、float、double 和 bfloat16)和复杂类型(cfloat、cdouble)的 Half 和 Double 类型。Tensorrequires_grad=TrueTensorTensor

向后

计算给定张量相对于图叶的梯度总和。

毕业

计算并返回输出相对于输入的梯度之和。

正向模式自动微分

警告

此 API 处于测试阶段。尽管函数签名不太可能更改,但改进 在我们认为这一点稳定之前,已经规划了运维覆盖范围。

有关如何使用此 API 的详细步骤,请参阅前向模式 AD 教程

forward_ad.dual_level

正向 AD 的上下文管理器,其中所有正向 AD 计算都必须在上下文中进行。dual_level

forward_ad.make_dual

将张量值与其切线相关联,以创建用于正向 AD 梯度计算的 “dual Tensor” 。

forward_ad.unpack_dual

解压缩一个 “dual tensor” 以获得其 Tensor 值和其正向 AD 梯度。

forward_ad.enter_dual_level

进入新的研究生级别。

forward_ad.exit_dual_level

退出 Forward grad 级别。

forward_ad。UnpackedDualTensor 的

namedtuple 返回的 natuple 中,其中包含对偶张量的 primal 和 tangent 分量。unpack_dual()

功能更高的 API

警告

此 API 处于测试阶段。尽管函数签名不太可能更改,但 major 在我们认为这稳定之前,我们计划了对性能的改进。

本节包含基于上述基本 API 构建的 autograd 的更高级别 API 并允许您计算雅可比矩阵、黑森矩阵等。

此 API 适用于用户提供的函数,这些函数仅将 Tensor 作为输入并返回 只有 Tensors。 如果您的函数采用其他不是 Tensor 或未设置 requires_grad 的 Tensor 的参数, 您可以使用 Lambda 来捕获它们。 例如,对于一个接受三个输入的函数,一个 Tensor 我们需要雅可比矩阵,另一个 张量,该张量应被视为常量和布尔标志,因为您可以将其用作 .ff(input, constant, flag=flag)functional.jacobian(lambda x: f(x, constant, flag=flag), input)

functional.jacobian 函数

计算给定函数的雅可比行列式。

functional.hessian (功能.hessian)

计算给定标量函数的 Hessian 矩阵。

functional.vjp

计算向量与给定函数在输入给定点的雅可比行列式之间的点积。v

functional.jvp 的

计算给定函数在输入给定点的雅可比矩阵与向量 之间的点积。v

functional.vhp 的

计算给定标量函数在指定点的 vector 和 Hessian 之间的点积。v

functional.hvp 中

计算标量函数的 Hessian 矩阵与指定点的向量之间的点积。v

在本地禁用梯度计算

有关差异的更多信息,请参阅本地禁用梯度计算 在 no-grad 和 inference 模式以及其他相关机制之间 可能会与两者混淆。另请参阅本地禁用渐变计算,了解可用于本地禁用渐变的函数列表。

默认渐变布局

当非稀疏在 OR 期间收到非稀疏梯度时,按如下方式累积。paramparam.grad

如果 最初是 :param.gradNone

  1. 如果 的内存不重叠且密集,则 为 使用 strides 匹配创建(因此匹配 的 layout) 的 Layout) 。param.gradparamparam

  2. 否则,将使用 rowmajor-contiguous strides 创建。.grad

如果已经具有 non-sparse 属性:param.grad

  1. 如果 , 累积到 in-place,这将保留其步幅。create_graph=Falsebackward().grad

  2. 如果 , 替换为 new tensor ,它会尝试(但不能保证) 匹配先前存在的 的 步幅。create_graph=Truebackward().grad.grad + new grad.grad

默认行为(让 s 在 first 之前,以便根据 1 或 2 创建它们的布局), 并随时间保留(根据 3 或 4) 获得最佳性能。 对布局的调用或不会影响布局。.gradNonebackward()model.zero_grad()optimizer.zero_grad().grad

事实上,将所有 s 重置为每个 蓄积期,例如:.gradNone

for iterations...
    ...
    for param in model.parameters():
        param.grad = None
    loss.backward()

这样每次都会根据 1 或 2 重新创建它们, 是某些网络的有效替代方案,或者可以提高某些网络的性能。model.zero_grad()optimizer.zero_grad()

手动渐变布局

如果您需要手动控制 的步幅, 分配具有所需步幅的归零张量 在第一个 之前,并且永远不要将其重置为 。 3 保证您的布局在满足 . 4 表示即使 ..gradparam.grad =backward()Nonecreate_graph=Falsecreate_graph=True

对 Tensor 的就地操作

在 autograd 中支持就地操作是一件困难的事情,我们不鼓励这样做 它们在大多数情况下的使用。Autograd 激进的缓冲区释放和重用使 它非常有效,并且很少有就地操作的情况 实际上,将内存使用量降低了任何显著的量。除非您正在操作 在内存压力很大的情况下,您可能永远不需要使用它们。

就地正确性检查

所有 s 都会跟踪应用于它们的就地操作,并且 如果实现检测到张量被保存为 backward in one of 函数,但之后被就地修改,则会引发错误 一旦 backward pass 开始。这可确保在就地使用 函数,并且没有看到任何错误,则可以确保计算出的 梯度是正确的。Tensor

变量 (已弃用)

警告

变量 API 已弃用:不再需要变量 将 autograd 与 Tensors 结合使用。Autograd 自动支持设置为 .请在下面找到有关以下内容的快速指南 已更改:requires_gradTrue

  • Variable(tensor)并且仍然按预期工作, 但它们返回 Tensor 而不是 Variables。Variable(tensor, requires_grad)

  • var.data与 是一回事。tensor.data

  • 现在,方法适用于张量 具有相同的方法名称。var.backward(), var.detach(), var.register_hook()

此外,现在可以使用 using factory 创建张量 方法,如 、 等 如下所示:requires_grad=True

autograd_tensor = torch.randn((2, 3, 4), requires_grad=True)

Tensor autograd 函数

torch.Tensor.grad

默认情况下,此属性在第一次调用计算 的梯度时变为 Tensor。Noneself

torch.Tensor.requires_grad

是如果需要为此 Tensor 计算梯度,否则。TrueFalse

torch.Tensor.is_leaf

按照约定,所有具有 which is 的 Tensor 都将是叶 Tensor。requires_gradFalse

torch.Tensor.backward([梯度, ...])

计算当前张量 wrt 图叶子的梯度。

torch.Tensor.detach

返回与当前图形分离的新 Tensor。

torch.Tensor.detach_

将 Tensor 与创建它的图形分离,使其成为叶子。

torch.Tensor.register_hook(钩子)

注册一个向后钩子。

torch.Tensor.register_post_accumulate_grad_hook(钩子)

注册一个在 grad 累积后运行的 backward hook。

torch.Tensor.retain_grad()

允许此 Tensor 在 期间填充其

功能

torch.autograd 中。函数*args**kwargs[来源]

Base 类创建自定义 autograd。功能

创建自定义 autograd.Function,将此类子类化并实现 和 static 方法。然后,要使用您的自定义 op 中,调用 class method 。不要直接打电话apply

为确保正确性和最佳性能,请确保调用 正确的方法并使用 验证你的后向函数ctx

有关如何使用此类的更多详细信息,请参阅扩展 torch.autograd

例子:

>>> class Exp(Function):
>>>     @staticmethod
>>>     def forward(ctx, i):
>>>         result = i.exp()
>>>         ctx.save_for_backward(result)
>>>         return result
>>>
>>>     @staticmethod
>>>     def backward(ctx, grad_output):
>>>         result, = ctx.saved_tensors
>>>         return grad_output * result
>>>
>>> # Use it by calling the apply method:
>>> output = Exp.apply(input)

函数.forward

定义自定义 autograd 函数的转发。

函数.backward

定义一个公式,用于区分具有 backward mode automatic differentiation 的操作。

函数.jvp

定义一个公式,用于使用正向模式自动微分来区分操作。

函数.vmap

定义此 autograd 的行为。功能下 .

上下文方法混入

创建新 时,ctx 可以使用以下方法。

功能。FunctionCtx.mark_dirty

将给定的张量标记为在就地操作中修改。

功能。FunctionCtx.mark_non_differentiable

将 output 标记为不可微分。

功能。FunctionCtx.save_for_backward

保存给定的张量以供将来调用 .

功能。FunctionCtx.set_materialize_grads

设置是否物化 grad 张量。

自定义函数实用程序

Decorator 用于 backward 方法。

function.once_differentiable

用于构建 PyTorch 实用程序的基本自定义

功能。BackwardCFunction

这个类用于内部 autograd 工作。

功能。InplaceFunction (原位函数)

此类仅出于向后兼容性的原因。

功能。NestedIOFunction 函数

此类仅出于向后兼容性的原因。

数值梯度检查

gradcheck

检查通过小有限差分计算的梯度与浮点或复数类型的解析梯度 wrt 张量,其中 为 。inputsrequires_grad=True

gradgradcheck

检查通过小有限差分计算的梯度的梯度与浮点或复数类型的解析梯度 wrt 张量 in 和 中。inputsgrad_outputsrequires_grad=True

GradcheckError

引发的错误。

分析器

Autograd 包含一个分析器,可让您检查不同 运算符 - 在 CPU 和 GPU 上。有三种模式 目前实现 - 仅使用 CPU 。 基于 nvprof 的(同时注册 CPU 和 GPU 活动)使用 . 和基于 vtune 分析器的 vtune 分析器。

torch.autograd.profiler 中。profileenabled=True*use_cuda=Falseuse_device=record_shapes=Falsewith_flops=Falseprofile_memory=Falsewith_stack=Falsewith_modules=Falseuse_kineto=Falseuse_cpu=Trueexperimental_config=Noneacc_events=False[来源]

管理 autograd 分析器状态并保存结果摘要的上下文管理器。

在后台,它只记录在 C++ 中执行的函数的事件,并且 将这些事件公开给 Python。您可以将任何代码包装到其中,它将 仅报告 PyTorch 函数的运行时。 注意:profiler 是线程本地的,会自动传播到异步任务中

参数
  • enabledbooloptional) – 将此设置为 False 将使此上下文管理器为空操作。

  • use_cudabool可选) – 同时启用 CUDA 事件的计时 使用 cudaEvent API。(将被弃用)

  • use_devicestroptional) – 启用设备事件的计时。 使用 cuda 时,每个张量操作增加大约 4us 的开销。 有效的设备选项包括 'cuda'、'xpu'、'mtia' 和 'privateuseone'。

  • record_shapesbooloptional) – 如果设置了形状记录,则信息 将收集 About input 维度。这允许人们看到哪个 维度已在后台使用,并由它们进一步分组 使用 prof.key_averages(group_by_input_shape=True)。请注意, 形状记录可能会扭曲您的分析数据。建议 使用带和不带形状记录的单独运行来验证计时。 对于最底层的事件(在某些情况下,偏斜可以忽略不计 的嵌套函数调用)。但对于更高级别的函数,总 自身 CPU 时间可能会因形状 收集。

  • with_flopsbooloptional) – 如果设置了 with_flops,分析器将估计 使用运算符的输入形状的 FLOPs(浮点运算)值。 这允许估计硬件性能。现在 此选项仅适用于矩阵乘法和 2D 卷积运算符。

  • profile_memorybooloptional) – 跟踪张量内存分配/释放。

  • with_stackbooloptional) – 记录操作的源信息 (文件和行号)。

  • with_modulesbool) – 记录模块层次结构(包括函数名称) 对应于 op 的 callstack。例如,如果模块 A 的 forward 调用的 模块 B 的 forward 包含一个 aten::add 操作, 那么 aten::add 的模块层次结构是 A.B 请注意,目前仅对 TorchScript 模型提供此支持 而不是 Eager Mode 模型。

  • use_kinetobooloptional) – 实验性,使用 Kineto 分析器启用性能分析。

  • use_cpubooloptional) – 分析 CPU 事件;设置为 requires 并可用于降低仅 GPU 分析的开销。Falseuse_kineto=True

  • experimental_config_ExperimentalConfig) – 一组实验性选项 由 Kineto 等分析器库使用。请注意,不能保证向后兼容性。

  • acc_eventsbool) – 在多个分析周期中启用 FunctionEvents 的累积

>>> x = torch.randn((1, 1), requires_grad=True)
>>> with torch.autograd.profiler.profile() as prof:
>>>     for _ in range(100):  # any normal python code, really!
>>>         y = x ** 2
>>>         y.backward()
>>> # NOTE: some columns were removed for brevity
>>> print(prof.key_averages().table(sort_by="self_cpu_time_total"))
-----------------------------------  ---------------  ---------------  ---------------
Name                                 Self CPU total   CPU time avg     Number of Calls
-----------------------------------  ---------------  ---------------  ---------------
mul                                  32.048ms         32.048ms         200
pow                                  27.041ms         27.041ms         200
PowBackward0                         9.727ms          55.483ms         100
torch::autograd::AccumulateGrad      9.148ms          9.148ms          100
torch::autograd::GraphRoot           691.816us        691.816us        100
-----------------------------------  ---------------  ---------------  ---------------

profiler.profile.export_chrome_trace

将 EventList 导出为 Chrome 跟踪工具文件。

profiler.profile.key_averages

将所有函数事件的键平均。

profiler.profile.self_cpu_time_total

返回 CPU 上花费的总时间。

profiler.profile.total_average

对所有事件求平均值。

profiler.parse_nvprof_trace

分析器。强制唯一

如果多次看到某个键,则引发错误。

分析器。KinetoStepTracker (电影到步跟踪器)

提供用于全局递增步数的抽象。

profiler.record_function

上下文管理器/函数装饰器,在运行 autograd 分析器时为代码块/函数添加标签。

profiler_util。间隔

profiler_util。内核

profiler_util。MemRecordsAcc 公司

用于间隔访问 mem_records 的加速结构。

profiler_util。字符串表

torch.autograd.profiler 中。emit_nvtxenabled=Truerecord_shapes=False[来源]

上下文管理器,使每个 autograd 操作发出 NVTX 范围。

在 nvprof 下运行程序时,它很有用:

nvprof --profile-from-start off -o trace_name.prof -- <regular command here>

不幸的是,没有办法强制 nvprof 刷新它收集的数据 到磁盘,因此对于 CUDA 分析,必须使用此上下文管理器来注释 nvprof 跟踪并等待进程退出,然后再检查它们。 然后,可以使用 NVIDIA Visual Profiler (nvvp) 来可视化时间线,也可以加载结果进行检查 例如,在 Python REPL 中。

参数
  • enabledbooloptional) – 设置此上下文管理器为空操作。 违约:。enabled=FalseTrue

  • record_shapesbooloptional) – 如果 ,则 nvtx 范围包装 每个 autograd op 都会附加有关收到的 Tensor 参数大小的信息 通过该运算,格式如下:非张量参数将用 表示。 参数将按照后端操作接收它们的顺序列出。 请注意,此顺序可能与传递这些参数的顺序不匹配 在 Python 端。另请注意,形状录制可能会增加 nvtx 范围创建的开销。 违约:record_shapes=True[[arg0.size(0), arg0.size(1), ...], [arg1.size(0), arg1.size(1), ...], ...][]False

>>> with torch.cuda.profiler.profile():
...     model(x)  # Warmup CUDA memory allocator and profiler
...     with torch.autograd.profiler.emit_nvtx():
...         model(x)

前向-后向关联

在 Nvidia Visual Profiler 中查看使用 创建的配置文件时, 将每个向后传递 OP 与相应的前向传递 OP 相关联可能很困难。 为了简化此任务,将序列号信息附加到 it 生成。

在前向传递期间,每个函数范围都用 . 是正在运行的 counter,每次创建新的 backward Function 对象并储藏为 backward 时递增。 因此,与每个前向函数范围关联的注释告诉您 如果 backward Function 对象是由这个 forward 函数创建的,则 向后对象将接收序列号 N。 在向后传递期间,包装每个 C++ 向后函数调用的顶级范围用 . 是 创建 backward 对象时使用。通过比较 backward 中的数字和 forward 中的数字,您可以跟踪哪个 forward op 创建了每个 backward Function。seq=<N>seqseq=<N>apply()stashed seq=<M>Mstashed seqseq

在向后传递期间执行的任何函数也都用 .在 default backward (with ) 此信息无关紧要,事实上,对于所有此类函数,可能只是 0。仅与 向后 Function 对象的方法很有用,可以作为关联这些 Function 的一种方式 对象。seq=<N>create_graph=FalseNapply()

双后退

另一方面,如果正在进行向后传递 with(换句话说, 如果要设置双向后),则每个函数在 Backward 被赋予一个非零的、有用的 。这些函数本身可以创建 Function 对象 稍后在 double-backward 期间执行,就像 forward pass 中的原始函数一样。 backward 和 double-backward 之间的关系在概念上与关系相同 between forward and backward:函数仍然发出当前序列号标记的范围, 它们创建的 Function 对象仍然会存储这些序列号,并且在最终的 double-backward 时,Function 对象的范围仍然用数字标记,这些数字可以与 backward pass 中的 seq 数字进行比较。create_graph=Trueseq=<N>apply()stashed seq

torch.autograd.profiler 中。emit_ittenabled=Truerecord_shapes=False[来源]

上下文管理器,它使每个 autograd 操作都发出一个 ITT 范围。

在 Intel(R) VTune Profiler 下运行程序时,它非常有用:

vtune <--vtune-flags> <regular command here>

检测和跟踪技术 (ITT) API 使您的应用程序能够生成和 在跨不同 Intel 工具执行跟踪数据期间控制跟踪数据的收集。 此上下文管理器用于注释 Intel(R) VTune Profiling 跟踪。在这个上下文管理器的帮助下, 您将能够在 Intel(R) VTune Profiler GUI 中看到带标签的范围。

参数
  • enabledbooloptional) – 设置此上下文管理器为空操作。 违约:。enabled=FalseTrue

  • record_shapesbooloptional) – 如果 , itt 范围包装 每个 autograd op 都会附加有关收到的 Tensor 参数大小的信息 通过该运算,格式如下:非张量参数将用 表示。 参数将按照后端操作接收它们的顺序列出。 请注意,此顺序可能与传递这些参数的顺序不匹配 在 Python 端。另请注意,形状录制可能会增加 itt 范围创建的开销。 违约:record_shapes=True[[arg0.size(0), arg0.size(1), ...], [arg1.size(0), arg1.size(1), ...], ...][]False

>>> with torch.autograd.profiler.emit_itt():
...     model(x)

profiler.load_nvprof

打开 nvprof 跟踪文件并解析 autograd 注释。

调试和异常检测

torch.autograd 中。detect_anomalycheck_nan=True[来源]

Context-manager 为 autograd 引擎启用异常检测。

这执行两项操作:

  • 在启用检测的情况下运行正向传递将允许向后 pass 打印创建失败的 forward 操作的回溯 backward 函数。

  • 如果 is ,则生成 “nan” 的任何反向计算 值将引发错误。违约。check_nanTrueTrue

警告

此模式应仅用于调试,因为测试不同 会减慢程序的执行速度。

>>> import torch
>>> from torch import autograd
>>> class MyFunc(autograd.Function):
...     @staticmethod
...     def forward(ctx, inp):
...         return inp.clone()
...     @staticmethod
...     def backward(ctx, gO):
...         # Error during the backward pass
...         raise RuntimeError("Some error in backward")
...         return gO.clone()
>>> def run_fn(a):
...     out = MyFunc.apply(a)
...     return out.sum()
>>> inp = torch.rand(10, 10, requires_grad=True)
>>> out = run_fn(inp)
>>> out.backward()
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
      File "/your/pytorch/install/torch/_tensor.py", line 93, in backward
        torch.autograd.backward(self, gradient, retain_graph, create_graph)
      File "/your/pytorch/install/torch/autograd/__init__.py", line 90, in backward
        allow_unreachable=True)  # allow_unreachable flag
      File "/your/pytorch/install/torch/autograd/function.py", line 76, in apply
        return self._forward_cls.backward(self, *args)
      File "<stdin>", line 8, in backward
    RuntimeError: Some error in backward
>>> with autograd.detect_anomaly():
...     inp = torch.rand(10, 10, requires_grad=True)
...     out = run_fn(inp)
...     out.backward()
    Traceback of forward call that caused the error:
      File "tmp.py", line 53, in <module>
        out = run_fn(inp)
      File "tmp.py", line 44, in run_fn
        out = MyFunc.apply(a)
    Traceback (most recent call last):
      File "<stdin>", line 4, in <module>
      File "/your/pytorch/install/torch/_tensor.py", line 93, in backward
        torch.autograd.backward(self, gradient, retain_graph, create_graph)
      File "/your/pytorch/install/torch/autograd/__init__.py", line 90, in backward
        allow_unreachable=True)  # allow_unreachable flag
      File "/your/pytorch/install/torch/autograd/function.py", line 76, in apply
        return self._forward_cls.backward(self, *args)
      File "<stdin>", line 8, in backward
    RuntimeError: Some error in backward
torch.autograd 中。set_detect_anomaly模式check_nan=True[来源]

Context-manager,用于打开或关闭 autograd 引擎的异常检测。

set_detect_anomaly将启用或禁用 Autograd 异常检测 基于其参数。 它可以用作上下文管理器或函数。mode

有关异常检测行为的详细信息,请参阅上文。detect_anomaly

参数
  • modebool) – 标记是否启用异常检测 (), 或 disable ()。TrueFalse

  • check_nanbool) – 标记是否在向后 生成 “Nan”

grad_mode.set_multithreading_enabled

向后设置多线程打开或关闭的上下文管理器。

Autograd 图

Autograd 公开了一些方法,这些方法允许人们检查图形并在 向后传递。

如果张量是 autograd 记录的操作的输出(即 grad_mode 为 enabled 且至少有一个 inputs 需要梯度),否则。grad_fntorch.autograd.graph.NodeNone

graph.Node.name

返回名称。

图。Node.metadata (节点元数据)

返回元数据。

图。Node.next_functions

图。Node.register_hook

注册一个向后钩子。

图。Node.register_prehook

注册一个向后预钩子。

graph.increment_version

更新 autograd 元数据,跟踪给定的 Tensor 是否已就地修改。

某些操作需要在正向传递期间保存中间结果 以执行向后传递。 这些中间结果将保存为 上的属性,并且可以访问。 例如:grad_fn

>>> a = torch.tensor([0., 0., 0.], requires_grad=True)
>>> b = a.exp()
>>> print(isinstance(b.grad_fn, torch.autograd.graph.Node))
True
>>> print(dir(b.grad_fn))
['__call__', '__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '_raw_saved_result', '_register_hook_dict', '_saved_result', 'metadata', 'name', 'next_functions', 'register_hook', 'register_prehook', 'requires_grad']
>>> print(torch.allclose(b.grad_fn._saved_result, b))
True

您还可以定义如何使用钩子打包/解包这些保存的张量。 一个常见的应用程序是通过保存这些中间结果来交换计算来换取内存 到磁盘或 CPU,而不是将它们留在 GPU 上。如果您 请注意,您的模型在评估期间适合 GPU,但不适合训练。 另请参阅已保存张量的 Hooks

torch.autograd.graph 中。saved_tensors_hookspack_hookunpack_hook[来源]

为保存的张量设置一对 pack / unpack 钩子的上下文管理器。

使用此 context-manager 来定义操作的中间结果如何 应在保存之前打包,并在检索时解压缩。

在该上下文中,每次 操作保存一个张量用于向后(这包括中间结果 使用 but 保存 以及由 PyTorch 定义的操作记录的那些)。然后,的输出将存储在计算图中,而不是 原始张量。pack_hooksave_for_backward()pack_hook

当需要访问保存的张量时,将调用 The , 即在执行 时。它将打包对象作为参数 返回 和 应该返回一个具有相同 content 作为原始张量(作为输入传递给相应的 )。unpack_hookpack_hookpack_hook

钩子应具有以下签名:

pack_hook(tensor: Tensor) -> 任意

unpack_hook(任意) -> 张量

其中,返回值 of 是 的有效输入 。pack_hookunpack_hook

一般来说,您希望在以下方面相等 value、size、dtype 和 device。unpack_hook(pack_hook(t))t

例:

>>> def pack_hook(x):
...     print("Packing", x)
...     return x
>>>
>>> def unpack_hook(x):
...     print("Unpacking", x)
...     return x
>>>
>>> a = torch.ones(5, requires_grad=True)
>>> b = torch.ones(5, requires_grad=True) * 2
>>> with torch.autograd.graph.saved_tensors_hooks(pack_hook, unpack_hook):
...     y = a * b
Packing tensor([1., 1., 1., 1., 1.], requires_grad=True)
Packing tensor([2., 2., 2., 2., 2.], grad_fn=<MulBackward0>)
>>> y.sum().backward()
Unpacking tensor([1., 1., 1., 1., 1.], requires_grad=True)
Unpacking tensor([2., 2., 2., 2., 2.], grad_fn=<MulBackward0>)

警告

对任一 hook 的 input 执行就地操作可能会导致 更改为未定义的行为。

警告

一次只允许一对钩子。当递归嵌套 this 时 context-manager 中,只会应用最里面的一对钩子。

torch.autograd.graph 中。save_on_cpupin_memory=Falsedevice_type='cuda'[来源]

上下文管理器,其中 forward pass 保存的张量将存储在 cpu 上,然后检索用于 backward。

在此上下文管理器中执行操作时,中间 在正向传递期间保存在图表中的结果将移动到 CPU, 然后,在需要时复制回原始设备以进行向后传递。 如果图形已在 CPU 上,则不执行张量复制。

使用此上下文管理器将计算换成 GPU 内存使用(例如 当你的模型在训练期间不适合 GPU 内存时)。

参数

pin_memorybool) – 张量是否将保存到 CPU 固定内存 并在解包期间异步复制到 GPU。 默认为 。 另请参阅使用固定内存缓冲区TrueFalse

例:

>>> a = torch.randn(5, requires_grad=True, device="cuda")
>>> b = torch.randn(5, requires_grad=True, device="cuda")
>>> c = torch.randn(5, requires_grad=True, device="cuda")
>>>
>>> def f(a, b, c):
...     prod_1 = a * b           # a and b are saved on GPU
...     with torch.autograd.graph.save_on_cpu():
...         prod_2 = prod_1 * c  # prod_1 and c are saved on CPU
...     y = prod_2 * a           # prod_2 and a are saved on GPU
...     return y
>>>
>>> y = f(a, b, c)
>>> del a, b, c  # for illustration only
>>> # the content of a, b, and prod_2 are still alive on GPU
>>> # the content of prod_1 and c only live on CPU
>>> y.sum().backward()  # all CPU tensors are moved back to GPU, for backward
>>> # all intermediary tensors are released (deleted) after the call to backward
torch.autograd.graph 中。disable_saved_tensors_hookserror_message[来源]

禁用 saved tensors 默认钩子功能的 context-manager。

如果您正在创建不适用于 saved 的特征,则很有用 Tensors 默认钩子。

参数

error_messagestr) – 当保存的张量默认钩子在使用它们时 已被禁用,则 RuntimeError 带有此 错误消息。

返回类型

生成器 [无, 无, 无]

例:

>>> message = "saved tensors default hooks are disabled"
>>> with torch.autograd.graph.disable_saved_tensors_hooks(message):
...     # Raises RuntimeError: saved tensors default hooks are disabled
...     with torch.autograd.graph.save_on_cpu():
...         pass
torch.autograd.graph 中。register_multi_grad_hook张量, fn*mode='all'[来源]

注册一个 multi-grad backward hook。

有两种支持的模式:和 ."all""any"

在该模式下,将在计算了每个张量的梯度后调用 hook。如果张量位于 but 不是图形的一部分,或者不需要张量来计算梯度 对于为 current 或 call 指定的任何值, 这个张量将被忽略,并且 Hook 不会等待其 gradient 为 计算。"all"tensorstensorsinputs.backward().grad()

计算出每个非忽略张量的梯度后,将为 调用这些梯度。 将传递给未 计算它们的梯度。fnNone

在该模式下,钩子会在第一个梯度之后被调用 相对于 Tensor in 的 Tensor 中。钩子 将以该 gradient 作为其参数进行调用。"any"tensors

钩子不应该修改它的参数。

此函数返回一个 handle,其中包含一个用于删除钩子的方法。handle.remove()

注意

有关如何当此 Hook 被执行,以及它的执行相对于其他钩子的执行顺序。

例:

>>> import torch
>>>
>>> a = torch.rand(2, 3, requires_grad=True)
>>> b = torch.rand(2, 3, requires_grad=True)
>>> c = a * b
>>> d = a * b
>>>
>>> def fn(grads):
...     print([g is not None for g in grads])
...
>>> torch.autograd.graph.register_multi_grad_hook((a, b, c, d), fn)
>>>
>>> c.sum().backward(retain_graph=True)
[True, True, True, False]
>>> c.sum().backward(inputs=(a,), retain_graph=True)
[True, False, True, False]
>>>
返回类型

可移动手柄

torch.autograd.graph 中。allow_mutation_on_saved_tensors[来源]

上下文管理器,允许为向后保存的突变张量。

在这个上下文管理器下,保存用于 backward 的 tensor 在 mutation 时被克隆, 因此,在 Backward 期间仍然可以使用原始版本。通常,更改张量 saved for backward 将导致在 backward 期间使用时引发错误。

为了确保正确的行为,forward 和 backward 都应该在 相同的上下文管理器。

返回

一个 _AllowMutationOnSavedContext 对象,用于存储由 this 管理的状态 上下文管理器。此对象可用于调试目的。状态 managed by 上下文管理器 将在退出时自动清除。

返回类型

生成器 [_AllowMutationOnSavedContext, 无, 无]

例:

>>> import torch
>>> with torch.autograd.graph.allow_mutation_on_saved_tensors():
...     # forward
...     a = torch.ones(2, 3, requires_grad=True)
...     b = a.clone()
...     out = (b**2).sum()
...     b.sin_()
...     # backward
...     out.sum().backward()
...
tensor([[0.8415, 0.8415, 0.8415],
        [0.8415, 0.8415, 0.8415]], grad_fn=<SinBackward0>)
torch.autograd.graph 中。GradientEdgenodeoutput_nr[来源]

表示 autograd 图中给定渐变边缘的对象。

要获取将计算给定 Tensor 梯度的梯度边, 你可以执行 .edge = autograd.graph.get_gradient_edge(tensor)

torch.autograd.graph 中。get_gradient_edgetensor[来源]

获取梯度边以计算给定 Tensor 的梯度。

特别是,它等效于 call 和 。g = autograd.grad(loss, input)g = autograd.grad(loss, get_gradient_edge(input))

返回类型

渐变边缘

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源