再现性¶

在 PyTorch 版本中不保证完全可重现的结果，单个提交或不同的平台。此外，结果可能不是在 CPU 和 GPU 执行之间可重现，即使使用相同的种子也是如此。

但是，您可以采取一些步骤来限制特定平台、设备和 PyTorch 版本的非确定性行为。首先，您可以控制可能导致多次执行的随机性来源的行为不同。其次，您可以配置 PyTorch 为了避免对某些作使用非确定性算法，以便将多个在给定相同输入的情况下，对这些作的调用将产生相同的结果。

警告

确定性作通常比非确定性作慢，因此您的模型的单次运行性能可能会降低。但是，决定论可能会通过促进实验、调试和回归测试。

控制随机性来源¶

PyTorch 随机数生成器¶

您可以使用torch.manual_seed()为所有设备（同时 CPU 和 CUDA）：

import torch
torch.manual_seed(0)

某些 PyTorch作可能在内部使用随机数。torch.svd_lowrank()执行此作。因此，将其称为多次背靠背使用相同的输入参数可能会得到不同的结果。但是，只要torch.manual_seed()设置为常量在应用程序的开头，所有其他非确定性来源都有被消除，每次都会生成相同系列的随机数应用程序在同一环境中运行。

也可以使用随机数torch.manual_seed()到相同的值之间后续调用。

蟒¶

对于自定义运算符，您可能还需要设置 python seed：

import random
random.seed(0)

其他库中的随机数生成器¶

如果你或你正在使用的任何库依赖于 NumPy，你可以将全局 NumPy RNG 与：

import numpy as np
np.random.seed(0)

但是，某些应用程序和库可能会使用 NumPy Random Generator 对象，不是全球 RNG （https://numpy.org/doc/stable/reference/random/generator.html），而这些将还需要始终如一地播种。

如果您使用的是任何其他使用随机数生成器的库，请参阅这些库的文档，了解如何为它们设置一致的种子。

CUDA 卷积基准测试¶

CUDA 卷积运算使用的 cuDNN 库可能是不确定性的来源跨应用程序的多次执行。当使用新的 size 参数集，一个可选功能可以运行多个卷积算法，对它们进行基准测试以找到最快的。然后，将使用最快的算法在其余过程中，对于相应的 size 参数集保持一致。由于基准测试噪声和不同的硬件，基准测试可能会选择不同的算法，甚至在同一台计算机上。

禁用基准测试功能会导致 cuDNN 确定性地选择算法，其代价可能是降低性能。torch.backends.cudnn.benchmark = False

但是，如果您不需要在应用程序的多次执行之间实现可重复性，则如果使用启用了基准测试功能，则性能可能会提高。torch.backends.cudnn.benchmark = True

请注意，此设置与下面讨论的设置不同。torch.backends.cudnn.deterministic

避免非确定性算法¶

torch.use_deterministic_algorithms()允许您配置 PyTorch 以使用确定性算法而不是非确定性算法（如果可用），以及如果已知作是不确定的（并且没有确定性的替代方案）。

请查看文档torch.use_deterministic_algorithms()有关受影响作的完整列表。如果作未正确作根据文档，或者如果您需要确定性实现对于没有 THE ON 的作，请提交一个 issue：https://github.com/pytorch/pytorch/issues?q=label:%22module:%20determinism%22

例如，运行torch.Tensor.index_add_()将抛出一个错误：

>>> import torch
>>> torch.use_deterministic_algorithms(True)
>>> torch.randn(2, 2).cuda().index_add_(0, torch.tensor([0, 1]), torch.randn(2, 2))
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
RuntimeError: index_add_cuda_ does not have a deterministic implementation, but you set
'torch.use_deterministic_algorithms(True)'. ...

什么时候torch.bmm()使用稀疏密集的 CUDA 张量调用时，它通常使用 nondeterministic 算法，但是当 deterministic 标志打开时，其 alternate 将使用确定性实现：

>>> import torch
>>> torch.use_deterministic_algorithms(True)
>>> torch.bmm(torch.randn(2, 2, 2).to_sparse().cuda(), torch.randn(2, 2, 2).cuda())
tensor([[[ 1.1900, -2.3409],
         [ 0.4796,  0.8003]],
        [[ 0.1509,  1.8027],
         [ 0.0333, -1.1444]]], device='cuda:0')

此外，如果您使用的是 CUDA 张量，并且您的 CUDA 版本为 10.2 或更高版本，则应根据 CUDA 文档设置环境变量 CUBLAS_WORKSPACE_CONFIG：https://docs.nvidia.com/cuda/cublas/index.html#results-reproducibility

CUDA 卷积确定性¶

虽然禁用 CUDA 卷积基准测试（如上所述），但可确保 CUDA 在每次运行应用程序时都会选择相同的算法，该算法本身可能是不确定的，除非设置了 OR。后一种设置仅控制此行为，与torch.use_deterministic_algorithms(True)torch.backends.cudnn.deterministic = Truetorch.use_deterministic_algorithms()这将使其他 PyTorch作也具有确定性的行为。

CUDA RNN 和 LSTM¶

在某些版本的 CUDA 中，RNN 和 LSTM 网络可能具有非确定性行为。看torch.nn.RNN()和torch.nn.LSTM()了解详细信息和解决方法。

填充未初始化的内存¶

作如torch.empty()和torch.Tensor.resize_()可以返回具有包含未定义值的未初始化内存的张量。使用这样的如果需要确定性，则作为另一个作的输入的 Tensor 无效，因为输出将是不确定的。但实际上没有什么可的防止此类无效代码运行。所以为了安全，torch.utils.deterministic.fill_uninitialized_memory设置为 by default，如果设置，则会用已知值填充未初始化的内存。这将防止这种非确定性行为的可能性。Truetorch.use_deterministic_algorithms(True)

但是，填充未初始化的内存对性能有害。因此，如果您的程序有效，并且不使用未初始化的内存作为作，则可以关闭此设置以获得更好的性能。

数据加载器¶

DataLoader 将在多进程数据加载算法中遵循随机性为 worker 重新设定种子。使用和生成器以保持可重复性：worker_init_fn()

def seed_worker(worker_id):
    worker_seed = torch.initial_seed() % 2**32
    numpy.random.seed(worker_seed)
    random.seed(worker_seed)

g = torch.Generator()
g.manual_seed(0)

DataLoader(
    train_dataset,
    batch_size=batch_size,
    num_workers=num_workers,
    worker_init_fn=seed_worker,
    generator=g,
)