自动微分包 - torch.autograd¶

torch.autograd提供实现任意标量值函数自动微分的类和函数。

它只需要对现有代码进行最少的更改 - 你只需要声明 s 对于哪些梯度，应该使用关键字计算。截至目前，我们只支持浮点类型（ half、float、double 和 bfloat16）和复杂类型（cfloat、cdouble）的 Half 和 Double 类型。Tensorrequires_grad=TrueTensorTensor

backward

计算给定张量相对于图叶的梯度总和。

grad

计算并返回输出相对于输入的梯度之和。

正向模式自动微分¶

警告

此 API 处于测试阶段。尽管函数签名不太可能更改，但改进在我们认为这一点稳定之前，已经规划了运维覆盖范围。

有关如何使用此 API 的详细步骤，请参阅前向模式 AD 教程。

`forward_ad.dual_level`	正向 AD 的上下文管理器，其中所有正向 AD 计算都必须在上下文中进行。`dual_level`
`forward_ad.make_dual`	将张量值与其切线相关联，以创建用于正向 AD 梯度计算的 “dual Tensor” 。
`forward_ad.unpack_dual`	解压缩一个 “dual tensor” 以获得其 Tensor 值和其正向 AD 梯度。
`forward_ad.enter_dual_level`	进入新的研究生级别。
`forward_ad.exit_dual_level`	退出 Forward grad 级别。
`forward_ad.UnpackedDualTensor`	namedtuple 返回的 natuple 中，其中包含对偶张量的 primal 和 tangent 分量。`unpack_dual()`

功能更高的 API¶

警告

此 API 处于测试阶段。尽管函数签名不太可能更改，但 major 在我们认为这稳定之前，我们计划了对性能的改进。

本节包含基于上述基本 API 构建的 autograd 的更高级别 API 并允许您计算雅可比矩阵、黑森矩阵等。

此 API 适用于用户提供的函数，这些函数仅将 Tensor 作为输入并返回只有 Tensors。如果您的函数采用其他不是 Tensor 或未设置 requires_grad 的 Tensor 的参数，您可以使用 Lambda 来捕获它们。例如，对于一个接受三个输入的函数，一个 Tensor 我们需要雅可比矩阵，另一个张量，该张量应被视为常量和布尔标志，因为您可以将其用作 .ff(input, constant, flag=flag)functional.jacobian(lambda x: f(x, constant, flag=flag), input)

`functional.jacobian`	计算给定函数的雅可比行列式。
`functional.hessian`	计算给定标量函数的 Hessian 矩阵。
`functional.vjp`	计算向量与给定函数在输入给定点的雅可比行列式之间的点积。`v`
`functional.jvp`	计算给定函数在输入给定点的雅可比矩阵与向量之间的点积。`v`
`functional.vhp`	计算给定标量函数在指定点的 vector 和 Hessian 之间的点积。`v`
`functional.hvp`	计算标量函数的 Hessian 矩阵与指定点的向量之间的点积。`v`

在本地禁用梯度计算¶

有关差异的更多信息，请参阅本地禁用梯度计算在 no-grad 和 inference 模式以及其他相关机制之间可能会与两者混淆。另请参阅本地禁用渐变计算，了解可用于本地禁用渐变的函数列表。

默认渐变布局¶

当非稀疏在paramtorch.autograd.backward()或torch.Tensor.backward() param.grad累积如下。

如果最初是：param.gradNone

如果的内存不重叠且密集，则为使用 strides 匹配创建（因此匹配的 layout）的 Layout）。param.gradparamparam
否则，将使用 rowmajor-contiguous strides 创建。.grad

如果已经具有 non-sparse 属性：param.grad

如果，累积到 in-place，这将保留其步幅。create_graph=Falsebackward().grad
如果，替换为 new tensor ，它会尝试（但不能保证）匹配先前存在的的步幅。create_graph=Truebackward().grad.grad + new grad.grad

默认行为（让 s 在 first 之前，以便根据 1 或 2 创建它们的布局），并随时间保留（根据 3 或 4）获得最佳性能。对布局的调用或不会影响布局。.gradNonebackward()model.zero_grad()optimizer.zero_grad().grad

事实上，将所有 s 重置为每个蓄积期，例如：.gradNone

for iterations...
    ...
    for param in model.parameters():
        param.grad = None
    loss.backward()

这样每次都会根据 1 或 2 重新创建它们，是某些网络的有效替代方案，或者可以提高某些网络的性能。model.zero_grad()optimizer.zero_grad()

手动渐变布局¶

如果您需要手动控制的步幅，分配具有所需步幅的归零张量在第一个之前，并且永远不要将其重置为。 3 保证您的布局在满足 . 4 表示即使 ..gradparam.grad =backward()Nonecreate_graph=Falsecreate_graph=True

对 Tensor 的就地作¶

在 autograd 中支持就地作是一件困难的事情，我们不鼓励这样做它们在大多数情况下的使用。Autograd 激进的缓冲区释放和重用使它非常有效，并且很少有就地作的情况实际上，将内存使用量降低了任何显著的量。除非您正在作在内存压力很大的情况下，您可能永远不需要使用它们。

就地正确性检查¶

所有 s 都会跟踪应用于它们的就地作，并且如果实现检测到张量被保存为 backward in one of 函数，但之后被就地修改，则会引发错误一旦 backward pass 开始。这可确保在就地使用函数，并且没有看到任何错误，则可以确保计算出的梯度是正确的。Tensor

变量（已弃用）¶

警告

变量 API 已弃用：不再需要变量将 autograd 与 Tensors 结合使用。Autograd 自动支持设置为 .请在下面找到有关以下内容的快速指南已更改：requires_gradTrue

Variable(tensor)并且仍然按预期工作，但它们返回 Tensor 而不是 Variables。Variable(tensor, requires_grad)
var.data与是一回事。tensor.data
现在，方法适用于张量具有相同的方法名称。var.backward(), var.detach(), var.register_hook()

此外，现在可以使用 using factory 创建张量方法，例如requires_grad=Truetorch.randn(),torch.zeros(),torch.ones()和其他如下所示：

autograd_tensor = torch.randn((2, 3, 4), requires_grad=True)

Tensor autograd 函数¶

`torch.Tensor.grad`	默认情况下，此属性会成为 Tensor`Nonebackward()`计算的梯度。`self`
`torch.Tensor.requires_grad`	是如果需要为此 Tensor 计算梯度，否则。`TrueFalse`
`torch.Tensor.is_leaf`	按照约定，所有具有 which is 的 Tensor 都将是叶 Tensor。`requires_gradFalse`
`torch.Tensor.backward`（[梯度， ...]）	计算当前张量 wrt 图叶子的梯度。
`torch.Tensor.detach`	返回与当前图形分离的新 Tensor。
`torch.Tensor.detach_`	将 Tensor 与创建它的图形分离，使其成为叶子。
`torch.Tensor.register_hook`（钩子）	注册一个向后钩子。
`torch.Tensor.register_post_accumulate_grad_hook`（钩子）	注册一个在 grad 累积后运行的 backward hook。
`torch.Tensor.retain_grad`()	使此 Tensor 具有其`grad`填充期间`backward()`.

功能¶

类 torch.autograd 中。函数（*args， **kwargs）[来源]¶

Base 类创建自定义 autograd。功能。

创建自定义 autograd.Function，将此类子类化并实现这forward()和backward()static 方法。然后，要使用您的自定义 op 中，调用 class method 。请勿调用applyforward()径直。

为确保正确性和最佳性能，请确保调用正确的方法并使用ctxtorch.autograd.gradcheck().

有关如何使用此类的更多详细信息，请参阅扩展 torch.autograd 。

例子：

>>> class Exp(Function):
>>>     @staticmethod
>>>     def forward(ctx, i):
>>>         result = i.exp()
>>>         ctx.save_for_backward(result)
>>>         return result
>>>
>>>     @staticmethod
>>>     def backward(ctx, grad_output):
>>>         result, = ctx.saved_tensors
>>>         return grad_output * result
>>>
>>> # Use it by calling the apply method:
>>> output = Exp.apply(input)

`Function.forward`	定义自定义 autograd 函数的转发。
`Function.backward`	定义一个公式，用于区分具有 backward mode automatic differentiation 的作。
`Function.jvp`	定义一个公式，用于使用正向模式自动微分来区分作。
`Function.vmap`	定义此 autograd 的行为。功能`torch.vmap()`.

上下文方法混入¶

创建新的Function，则 ctx 可以使用以下方法。

`function.FunctionCtx.mark_dirty`	将给定的张量标记为在就地作中修改。
`function.FunctionCtx.mark_non_differentiable`	将 output 标记为不可微分。
`function.FunctionCtx.save_for_backward`	保存给定的张量以供将来调用`backward()`.
`function.FunctionCtx.set_materialize_grads`	设置是否物化 grad 张量。

自定义函数实用程序¶

Decorator 用于 backward 方法。

function.once_differentiable

基础自定义Function用于构建 PyTorch 实用程序

`function.BackwardCFunction`	这个类用于内部 autograd 工作。
`function.InplaceFunction`	此类仅出于向后兼容性的原因。
`function.NestedIOFunction`	此类仅出于向后兼容性的原因。

数值梯度检查¶

gradcheck

检查通过小有限差分计算的梯度与浮点或复数类型的解析梯度 wrt 张量，其中为。inputsrequires_grad=True

gradgradcheck

检查通过小有限差分计算的梯度的梯度与浮点或复数类型的解析梯度 wrt 张量 in 和中。inputsgrad_outputsrequires_grad=True

GradcheckError

引发的错误gradcheck()和gradgradcheck().

分析器¶

Autograd 包含一个分析器，可让您检查不同运算符 - 在 CPU 和 GPU 上。有三种模式目前实现 - 仅使用 CPUprofile. 基于 nvprof 的（同时注册 CPU 和 GPU 活动），使用emit_nvtx. 和基于 using 的 vtune 分析器emit_itt.

类 torch.autograd.profiler 中。profile（enabled=True， *， use_cuda=False， use_device=无， record_shapes=False，with_flops=False， profile_memory=False， with_stack=False， with_modules=False， use_kineto=False， use_cpu=True， experimental_config=None， acc_events=False）[来源]¶

管理 autograd 分析器状态并保存结果摘要的上下文管理器。

在后台，它只记录在 C++ 中执行的函数的事件，并且将这些事件公开给 Python。您可以将任何代码包装到其中，它将仅报告 PyTorch 函数的运行时。注意：profiler 是线程本地的，会自动传播到异步任务中

参数

enabled （bool， optional） – 将此设置为 False 将使此上下文管理器为空作。
use_cuda （bool，可选） – 同时启用 CUDA 事件的计时使用 cudaEvent API。（将被弃用）
use_device （str， optional） – 启用设备事件的计时。使用 cuda 时，每个张量作增加大约 4us 的开销。有效的设备选项包括 'cuda'、'xpu'、'mtia' 和 'privateuseone'。
record_shapes （bool， optional） – 如果设置了形状记录，则信息将收集 About input 维度。这允许人们看到哪个维度已在后台使用，并由它们进一步分组使用 prof.key_averages（group_by_input_shape=True）。请注意，形状记录可能会扭曲您的分析数据。建议使用带和不带形状记录的单独运行来验证计时。对于最底层的事件（在某些情况下，偏斜可以忽略不计的嵌套函数调用）。但对于更高级别的函数，总自身 CPU 时间可能会因形状收集。
with_flops （bool， optional） – 如果设置了 with_flops，分析器将估计使用运算符的输入形状的 FLOPs（浮点运算）值。这允许估计硬件性能。现在此选项仅适用于矩阵乘法和 2D 卷积运算符。
profile_memory （bool， optional） – 跟踪张量内存分配/释放。
with_stack （bool， optional） – 记录作的源信息（文件和行号）。
with_modules （bool） – 记录模块层次结构（包括函数名称）对应于 op 的 callstack。例如，如果模块 A 的 forward 调用的模块 B 的 forward 包含一个 aten：：add作，那么 aten：：add 的模块层次结构是 A.B 请注意，目前仅对 TorchScript 模型提供此支持而不是 Eager Mode 模型。
use_kineto （bool， optional） – 实验性，使用 Kineto 分析器启用性能分析。
use_cpu （bool， optional） – 分析 CPU 事件;设置为 requires 并可用于降低仅 GPU 分析的开销。Falseuse_kineto=True
experimental_config （_ExperimentalConfig） – 一组实验性选项由 Kineto 等分析器库使用。请注意，不能保证向后兼容性。
acc_events （bool） – 在多个分析周期中启用 FunctionEvents 的累积

例

>>> x = torch.randn((1, 1), requires_grad=True)
>>> with torch.autograd.profiler.profile() as prof:
>>>     for _ in range(100):  # any normal python code, really!
>>>         y = x ** 2
>>>         y.backward()
>>> # NOTE: some columns were removed for brevity
>>> print(prof.key_averages().table(sort_by="self_cpu_time_total"))
-----------------------------------  ---------------  ---------------  ---------------
Name                                 Self CPU total   CPU time avg     Number of Calls
-----------------------------------  ---------------  ---------------  ---------------
mul                                  32.048ms         32.048ms         200
pow                                  27.041ms         27.041ms         200
PowBackward0                         9.727ms          55.483ms         100
torch::autograd::AccumulateGrad      9.148ms          9.148ms          100
torch::autograd::GraphRoot           691.816us        691.816us        100
-----------------------------------  ---------------  ---------------  ---------------

`profiler.profile.export_chrome_trace`	将 EventList 导出为 Chrome 跟踪工具文件。
`profiler.profile.key_averages`	将所有函数事件的键平均。
`profiler.profile.self_cpu_time_total`	返回 CPU 上花费的总时间。
`profiler.profile.total_average`	对所有事件求平均值。
`profiler.parse_nvprof_trace`
`profiler.EnforceUnique`	如果多次看到某个键，则引发错误。
`profiler.KinetoStepTracker`	提供用于全局递增步数的抽象。
`profiler.record_function`	上下文管理器/函数装饰器，在运行 autograd 分析器时为代码块/函数添加标签。
`profiler_util.Interval`
`profiler_util.Kernel`
`profiler_util.MemRecordsAcc`	用于间隔访问 mem_records 的加速结构。
`profiler_util.StringTable`

类 torch.autograd.profiler 中。emit_nvtx（enabled=True， record_shapes=False）[来源]¶

上下文管理器，使每个 autograd作发出 NVTX 范围。

在 nvprof 下运行程序时，它很有用：

nvprof --profile-from-start off -o trace_name.prof -- <regular command here>

不幸的是，没有办法强制 nvprof 刷新它收集的数据到磁盘，因此对于 CUDA 分析，必须使用此上下文管理器来注释 nvprof 跟踪并等待进程退出，然后再检查它们。然后，可以使用 NVIDIA Visual Profiler （nvvp）来可视化时间线，或者torch.autograd.profiler.load_nvprof()可以加载结果进行检查例如，在 Python REPL 中。

参数

enabled （bool， optional） – 设置此上下文管理器为空作。违约：。enabled=FalseTrue
record_shapes （bool， optional） – 如果，则 nvtx 范围包装每个 autograd op 都会附加有关收到的 Tensor 参数大小的信息通过该运算，格式如下：非张量参数将用表示。参数将按照后端作接收它们的顺序列出。请注意，此顺序可能与传递这些参数的顺序不匹配在 Python 端。另请注意，形状录制可能会增加 nvtx 范围创建的开销。违约：record_shapes=True[[arg0.size(0), arg0.size(1), ...], [arg1.size(0), arg1.size(1), ...], ...][]False

例

>>> with torch.cuda.profiler.profile():
...     model(x)  # Warmup CUDA memory allocator and profiler
...     with torch.autograd.profiler.emit_nvtx():
...         model(x)

前向-后向关联

查看使用emit_nvtx在 Nvidia Visual Profiler 中，将每个向后传递 OP 与相应的前向传递 OP 相关联可能很困难。为了简化这项任务，emit_nvtx将序列号信息附加到 it 的范围生成。

在前向传递期间，每个函数范围都用 . 是正在运行的 counter，每次创建新的 backward Function 对象并储藏为 backward 时递增。因此，与每个前向函数范围关联的注释告诉您如果 backward Function 对象是由这个 forward 函数创建的，则向后对象将接收序列号 N。在向后传递期间，包装每个 C++ 向后函数调用的顶级范围用 . 是创建 backward 对象时使用。通过比较 backward 中的数字和 forward 中的数字，您可以跟踪哪个 forward op 创建了每个 backward Function。seq=<N>seqseq=<N>apply()stashed seq=<M>Mstashed seqseq

在向后传递期间执行的任何函数也都用 .在 default backward （with ）此信息无关紧要，事实上，对于所有此类函数，可能只是 0。仅与向后 Function 对象的方法很有用，可以作为关联这些 Function 的一种方式对象。seq=<N>create_graph=FalseNapply()

双后退

另一方面，如果正在进行向后传递 with（换句话说，如果要设置双向后），则每个函数在 Backward 被赋予一个非零的、有用的。这些函数本身可以创建 Function 对象稍后在 double-backward 期间执行，就像 forward pass 中的原始函数一样。 backward 和 double-backward 之间的关系在概念上与关系相同 between forward and backward：函数仍然发出当前序列号标记的范围，它们创建的 Function 对象仍然会存储这些序列号，并且在最终的 double-backward 时，Function 对象的范围仍然用数字标记，这些数字可以与 backward pass 中的 seq 数字进行比较。create_graph=Trueseq=<N>apply()stashed seq

类 torch.autograd.profiler 中。emit_itt（enabled=True， record_shapes=False）[来源]¶

上下文管理器，它使每个 autograd作都发出一个 ITT 范围。

在 Intel（R） VTune Profiler 下运行程序时，它非常有用：

vtune <--vtune-flags> <regular command here>

检测和跟踪技术（ITT） API 使您的应用程序能够生成和在跨不同 Intel 工具执行跟踪数据期间控制跟踪数据的收集。此上下文管理器用于注释 Intel（R） VTune Profiling 跟踪。在这个上下文管理器的帮助下，您将能够在 Intel（R） VTune Profiler GUI 中看到带标签的范围。

参数

enabled （bool， optional） – 设置此上下文管理器为空作。违约：。enabled=FalseTrue
record_shapes （bool， optional） – 如果， itt 范围包装每个 autograd op 都会附加有关收到的 Tensor 参数大小的信息通过该运算，格式如下：非张量参数将用表示。参数将按照后端作接收它们的顺序列出。请注意，此顺序可能与传递这些参数的顺序不匹配在 Python 端。另请注意，形状录制可能会增加 itt 范围创建的开销。违约：record_shapes=True[[arg0.size(0), arg0.size(1), ...], [arg1.size(0), arg1.size(1), ...], ...][]False

例

>>> with torch.autograd.profiler.emit_itt():
...     model(x)

profiler.load_nvprof

打开 nvprof 跟踪文件并解析 autograd 注释。

调试和异常检测¶

类 torch.autograd 中。detect_anomaly（check_nan=True）[来源]¶

Context-manager 为 autograd 引擎启用异常检测。

这执行两项作：

在启用检测的情况下运行正向传递将允许向后 pass 打印创建失败的 forward作的回溯 backward 函数。
如果 is ，则生成 “nan” 的任何反向计算值将引发错误。违约。check_nanTrueTrue

警告

此模式应仅用于调试，因为测试不同会减慢程序的执行速度。

例

>>> import torch
>>> from torch import autograd
>>> class MyFunc(autograd.Function):
...     @staticmethod
...     def forward(ctx, inp):
...         return inp.clone()
...     @staticmethod
...     def backward(ctx, gO):
...         # Error during the backward pass
...         raise RuntimeError("Some error in backward")
...         return gO.clone()
>>> def run_fn(a):
...     out = MyFunc.apply(a)
...     return out.sum()
>>> inp = torch.rand(10, 10, requires_grad=True)
>>> out = run_fn(inp)
>>> out.backward()
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
      File "/your/pytorch/install/torch/_tensor.py", line 93, in backward
        torch.autograd.backward(self, gradient, retain_graph, create_graph)
      File "/your/pytorch/install/torch/autograd/__init__.py", line 90, in backward
        allow_unreachable=True)  # allow_unreachable flag
      File "/your/pytorch/install/torch/autograd/function.py", line 76, in apply
        return self._forward_cls.backward(self, *args)
      File "<stdin>", line 8, in backward
    RuntimeError: Some error in backward
>>> with autograd.detect_anomaly():
...     inp = torch.rand(10, 10, requires_grad=True)
...     out = run_fn(inp)
...     out.backward()
    Traceback of forward call that caused the error:
      File "tmp.py", line 53, in <module>
        out = run_fn(inp)
      File "tmp.py", line 44, in run_fn
        out = MyFunc.apply(a)
    Traceback (most recent call last):
      File "<stdin>", line 4, in <module>
      File "/your/pytorch/install/torch/_tensor.py", line 93, in backward
        torch.autograd.backward(self, gradient, retain_graph, create_graph)
      File "/your/pytorch/install/torch/autograd/__init__.py", line 90, in backward
        allow_unreachable=True)  # allow_unreachable flag
      File "/your/pytorch/install/torch/autograd/function.py", line 76, in apply
        return self._forward_cls.backward(self, *args)
      File "<stdin>", line 8, in backward
    RuntimeError: Some error in backward

类 torch.autograd 中。set_detect_anomaly（模式，check_nan=True）[来源]¶

Context-manager，用于打开或关闭 autograd 引擎的异常检测。

set_detect_anomaly将启用或禁用 Autograd 异常检测基于其参数。它可以用作上下文管理器或函数。mode

有关异常检测行为的详细信息，请参阅上文。detect_anomaly

参数

mode （bool） – 标记是否启用异常检测（），或 disable （）。TrueFalse
check_nan （bool） – 标记是否在向后生成 “Nan”

grad_mode.set_multithreading_enabled

向后设置多线程打开或关闭的上下文管理器。

Autograd 图¶

Autograd 公开了一些方法，这些方法允许人们检查图形并在向后传递。

的grad_fntorch.Tensor如果张量是 autograd 记录的作的输出（即 grad_mode 为 enabled 且至少有一个 inputs 需要梯度），否则。torch.autograd.graph.NodeNone

`graph.Node.name`	返回名称。
`graph.Node.metadata`	返回元数据。
`graph.Node.next_functions`
`graph.Node.register_hook`	注册一个向后钩子。
`graph.Node.register_prehook`	注册一个向后预钩子。
`graph.increment_version`	更新 autograd 元数据，跟踪给定的 Tensor 是否已就地修改。

某些作需要在正向传递期间保存中间结果以执行向后传递。这些中间结果将保存为上的属性，并且可以访问。例如：grad_fn

>>> a = torch.tensor([0., 0., 0.], requires_grad=True)
>>> b = a.exp()
>>> print(isinstance(b.grad_fn, torch.autograd.graph.Node))
True
>>> print(dir(b.grad_fn))
['__call__', '__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '_raw_saved_result', '_register_hook_dict', '_saved_result', 'metadata', 'name', 'next_functions', 'register_hook', 'register_prehook', 'requires_grad']
>>> print(torch.allclose(b.grad_fn._saved_result, b))
True

您还可以定义如何使用钩子打包/解包这些保存的张量。一个常见的应用程序是通过保存这些中间结果来交换计算来换取内存到磁盘或 CPU，而不是将它们留在 GPU 上。如果您请注意，您的模型在评估期间适合 GPU，但不适合训练。另请参阅已保存张量的 Hooks。

类 torch.autograd.graph 中。saved_tensors_hooks（pack_hook， unpack_hook）[来源]¶

为保存的张量设置一对 pack / unpack 钩子的上下文管理器。

使用此 context-manager 来定义作的中间结果如何应在保存之前打包，并在检索时解压缩。

在该上下文中，每次作保存一个张量用于向后（这包括中间结果使用 but 保存以及由 PyTorch 定义的作记录的那些）。然后，的输出将存储在计算图中，而不是原始张量。pack_hooksave_for_backward()pack_hook

当需要访问保存的张量时，将调用 The ，即在执行unpack_hooktorch.Tensor.backward()或torch.autograd.grad().它将打包对象作为参数返回和应该返回一个具有相同 content 作为原始张量（作为输入传递给相应的）。pack_hookpack_hook

钩子应具有以下签名：

pack_hook（tensor： Tensor） -> 任意

unpack_hook（任意） -> 张量

其中，返回值 of 是的有效输入。pack_hookunpack_hook

一般来说，您希望在以下方面相等 value、size、dtype 和 device。unpack_hook(pack_hook(t))t

例：

>>> def pack_hook(x):
...     print("Packing", x)
...     return x
>>>
>>> def unpack_hook(x):
...     print("Unpacking", x)
...     return x
>>>
>>> a = torch.ones(5, requires_grad=True)
>>> b = torch.ones(5, requires_grad=True) * 2
>>> with torch.autograd.graph.saved_tensors_hooks(pack_hook, unpack_hook):
...     y = a * b
Packing tensor([1., 1., 1., 1., 1.], requires_grad=True)
Packing tensor([2., 2., 2., 2., 2.], grad_fn=<MulBackward0>)
>>> y.sum().backward()
Unpacking tensor([1., 1., 1., 1., 1.], requires_grad=True)
Unpacking tensor([2., 2., 2., 2., 2.], grad_fn=<MulBackward0>)

警告

对任一 hook 的 input 执行就地作可能会导致更改为未定义的行为。

警告

一次只允许一对钩子。当递归嵌套 this 时 context-manager 中，只会应用最里面的一对钩子。

类 torch.autograd.graph 中。save_on_cpu（pin_memory=False， device_type='cuda'）[来源]¶

上下文管理器，其中 forward pass 保存的张量将存储在 cpu 上，然后检索用于 backward。

在此上下文管理器中执行作时，中间在正向传递期间保存在图表中的结果将移动到 CPU，然后，在需要时复制回原始设备以进行向后传递。如果图形已在 CPU 上，则不执行张量复制。

使用此上下文管理器将计算换成 GPU 内存使用（例如当你的模型在训练期间不适合 GPU 内存时）。

参数: pin_memory （bool） – 张量是否将保存到 CPU 固定内存并在解包期间异步复制到 GPU。默认为。另请参阅使用固定内存缓冲区。TrueFalse

例：

>>> a = torch.randn(5, requires_grad=True, device="cuda")
>>> b = torch.randn(5, requires_grad=True, device="cuda")
>>> c = torch.randn(5, requires_grad=True, device="cuda")
>>>
>>> def f(a, b, c):
...     prod_1 = a * b           # a and b are saved on GPU
...     with torch.autograd.graph.save_on_cpu():
...         prod_2 = prod_1 * c  # prod_1 and c are saved on CPU
...     y = prod_2 * a           # prod_2 and a are saved on GPU
...     return y
>>>
>>> y = f(a, b, c)
>>> del a, b, c  # for illustration only
>>> # the content of a, b, and prod_2 are still alive on GPU
>>> # the content of prod_1 and c only live on CPU
>>> y.sum().backward()  # all CPU tensors are moved back to GPU, for backward
>>> # all intermediary tensors are released (deleted) after the call to backward

类 torch.autograd.graph 中。disable_saved_tensors_hooks（error_message）[来源]¶

禁用 saved tensors 默认钩子功能的 context-manager。

如果您正在创建不适用于 saved 的特征，则很有用 Tensors 默认钩子。

参数: error_message （str） – 当保存的张量默认钩子在使用它们时已被禁用，则 RuntimeError 带有此错误消息。
返回类型: 生成器 [无，无，无]

例：

>>> message = "saved tensors default hooks are disabled"
>>> with torch.autograd.graph.disable_saved_tensors_hooks(message):
...     # Raises RuntimeError: saved tensors default hooks are disabled
...     with torch.autograd.graph.save_on_cpu():
...         pass

类 torch.autograd.graph 中。register_multi_grad_hook（张量， fn， *， mode='all'）[来源]¶

注册一个 multi-grad backward hook。

有两种支持的模式：和 ."all""any"

在该模式下，将在计算了每个张量的梯度后调用 hook。如果张量位于 but 不是图形的一部分，或者不需要张量来计算梯度对于为 current 或 call 指定的任何值，这个张量将被忽略，并且 Hook 不会等待其 gradient 为计算。"all"tensorstensorsinputs.backward().grad()

计算出每个非忽略张量的梯度后，将为调用这些梯度。将传递给未计算它们的梯度。fnNone

在该模式下，钩子会在第一个梯度之后被调用相对于 Tensor in 的 Tensor 中。钩子将以该 gradient 作为其参数进行调用。"any"tensors

钩子不应该修改它的参数。

此函数返回一个 handle，其中包含一个用于删除钩子的方法。handle.remove()

注意

有关如何当此 Hook 被执行，以及它的执行相对于其他钩子的执行顺序。

例：

>>> import torch
>>>
>>> a = torch.rand(2, 3, requires_grad=True)
>>> b = torch.rand(2, 3, requires_grad=True)
>>> c = a * b
>>> d = a * b
>>>
>>> def fn(grads):
...     print([g is not None for g in grads])
...
>>> torch.autograd.graph.register_multi_grad_hook((a, b, c, d), fn)
>>>
>>> c.sum().backward(retain_graph=True)
[True, True, True, False]
>>> c.sum().backward(inputs=(a,), retain_graph=True)
[True, False, True, False]
>>>

返回类型: 可移动手柄

类 torch.autograd.graph 中。allow_mutation_on_saved_tensors[来源]¶

上下文管理器，允许为向后保存的突变张量。

在这个上下文管理器下，保存用于 backward 的 tensor 在 mutation 时被克隆，因此，在 Backward 期间仍然可以使用原始版本。通常，更改张量 saved for backward 将导致在 backward 期间使用时引发错误。

为了确保正确的行为，forward 和 backward 都应该在相同的上下文管理器。

返回: 一个 _AllowMutationOnSavedContext 对象，用于存储由 this 管理的状态上下文管理器。此对象可用于调试目的。状态 managed by 上下文管理器将在退出时自动清除。
返回类型: 生成器 [_AllowMutationOnSavedContext，无，无]

例：

>>> import torch
>>> with torch.autograd.graph.allow_mutation_on_saved_tensors():
...     # forward
...     a = torch.ones(2, 3, requires_grad=True)
...     b = a.clone()
...     out = (b**2).sum()
...     b.sin_()
...     # backward
...     out.sum().backward()
...
tensor([[0.8415, 0.8415, 0.8415],
        [0.8415, 0.8415, 0.8415]], grad_fn=<SinBackward0>)

类 torch.autograd.graph 中。GradientEdge（node， output_nr）[来源]¶

表示 autograd 图中给定渐变边缘的对象。

要获取将计算给定 Tensor 梯度的梯度边，你可以执行 .edge = autograd.graph.get_gradient_edge(tensor)

torch.autograd.graph 中。get_gradient_edge（tensor）[来源]¶

获取梯度边以计算给定 Tensor 的梯度。

特别是，它等效于 call 和。g = autograd.grad(loss, input)g = autograd.grad(loss, get_gradient_edge(input))

返回类型: 渐变边缘

自动微分包 - torch.autograd¶

正向模式自动微分¶

功能更高的 API¶

在本地禁用梯度计算¶

默认渐变布局¶

手动渐变布局¶

对 Tensor 的就地作¶

就地正确性检查¶

变量（已弃用）¶

Tensor autograd 函数¶

功能¶

上下文方法混入¶

自定义函数实用程序¶

数值梯度检查¶

分析器¶

调试和异常检测¶

Autograd 图¶

文档

教程

资源

自动微分包 - torch.autograd¶

正向模式自动微分¶

功能更高的 API¶

在本地禁用梯度计算¶

默认渐变布局¶

手动渐变布局¶

对 Tensor 的就地作¶

就地正确性检查¶

变量 （已弃用）¶

Tensor autograd 函数¶

功能¶

上下文方法混入¶

自定义函数实用程序¶

数值梯度检查¶

分析器¶

调试和异常检测¶

Autograd 图¶

文档

教程

资源

变量（已弃用）¶