安装预编译二进制文件¶

torchaudio 为 PyPI (pip) 和 Anaconda (conda) 提供二进制发行版。

请参考 https://pytorch.org/get-started/locally/ 了解详细信息。

注意

每个 torchaudio 包都是针对特定版本的 torch 进行编译的。请参考下表，安装正确的 torch 和 torchaudio 组合。

注意

开始 0.10, torchaudio 有仅支持 CPU 和启用 CUDA 的二进制发行版, 每种都需要对应的 PyTorch 发行版。

注意

此软件是针对未修改的FFmpeg副本编译的，已移除特定的rpath，以便使用系统库。LGPL源代码可以从以下位置下载： n4.1.8 (许可协议)，n5.0.3 (许可协议) 和 n6.0 (许可协议)。

依赖项¶

PyTorch

请参考下表中的兼容性矩阵，了解支持的 PyTorch 版本。

可选依赖项¶

FFmpeg

Required to use torchaudio.io module. and backend="ffmpeg" in I/O functions.

从 2.1 版本开始，TorchAudio 的官方二进制发行版兼容 FFmpeg 6、5 和 4 版本。（>=4.4, <7）。在运行时，TorchAudio 首先查找 FFmpeg 6，如果没有找到，则继续查找 5，再查找 4。

安装FFmpeg库有多种方法。请参考官方文档了解如何安装FFmpeg。如果你使用的是Anaconda Python发行版, conda install -c conda-forge 'ffmpeg<7' 将安装兼容的FFmpeg库。

如果你需要指定FFmpeg的版本，TorchAudio会搜索并链接到该版本，你可以通过环境变量TORIO_USE_FFMPEG_VERSION来指定。例如，通过设置TORIO_USE_FFMPEG_VERSION=5，TorchAudio将只查找FFmpeg 5。

如果由于某些原因，此搜索机制导致了问题，您可以通过设置环境变量 TORIO_USE_FFMPEG=0 完全禁用 FFmpeg 集成。

安装FFmpeg库有多种方法。如果你使用的是Anaconda Python发行版, conda install -c conda-forge 'ffmpeg<7' 将安装兼容的FFmpeg库。

注意

当搜索FFmpeg安装时，TorchAudio会查找带有版本号的库文件名称。也就是说，Linux使用libavutil.so.<VERSION>，macOS使用libavutil.<VERSION>.dylib， Windows使用avutil-<VERSION>.dll。许多公共的预编译二进制文件遵循这种命名方案，但某些发行版具有未带版本号的文件名。如果你在检测FFmpeg时遇到困难，请再次确认你安装的库文件是否遵循此命名方案，（然后确保它们位于库搜索路径中列出的目录之一。）
SoX

Required to use backend="sox" in I/O functions.

从 2.1 版本开始，TorchAudio 需要单独安装 libsox。

如果动态链接导致问题，您可以设置环境变量 TORCHAUDIO_USE_SOX=0，这样 TorchAudio 将不会使用 SoX。

注意

TorchAudio 会查找一个未带版本号的库文件，即 libsox.so 用于 Linux，而 libsox.dylib 用于 macOS。一些包管理器会以不同的名称安装库文件。例如，Ubuntu 上的 aptitude 会安装 libsox.so.3。为了让 TorchAudio 链接到它，你可以创建一个名为 libsox.so 的符号链接（并将该符号链接放在库搜索路径中）。

注意

TorchAudio 在 libsox 14.4.2 上进行了测试。（其他版本可能无法正常工作。）
SoundFile

Required to use backend="soundfile" in I/O functions.
sentencepiece

需要用于通过 Emformer RNN-T 进行自动语音识别。你可以通过运行 pip install sentencepiece 来安装它。
deep-phonemizer

执行文本转语音所需的 Tacotron2 文本转语音。
kaldi_io

需要使用 torchaudio.kaldi_io 模块。

兼容性矩阵¶

TorchAudio 的官方二进制发行版包含用 C++ 编写的扩展模块，并链接到特定版本的 PyTorch。

不同版本的 TorchAudio 和 PyTorch 无法一起使用。请参考下表以获取对应的版本。

`PyTorch`	`TorchAudio`	`Python`
`2.1.0`	`2.1.0`	`>=3.8`, `<=3.11`
`2.0.1`	`2.0.2`	`>=3.8`, `<=3.11`
`2.0.0`	`2.0.1`	`>=3.8`, `<=3.11`
`1.13.1`	`0.13.1`	`>=3.7`, `<=3.10`
`1.13.0`	`0.13.0`	`>=3.7`, `<=3.10`
`1.12.1`	`0.12.1`	`>=3.7`, `<=3.10`
`1.12.0`	`0.12.0`	`>=3.7`, `<=3.10`
`1.11.0`	`0.11.0`	`>=3.7`, `<=3.9`
`1.10.0`	`0.10.0`	`>=3.6`, `<=3.9`
`1.9.1`	`0.9.1`	`>=3.6`, `<=3.9`
`1.8.1`	`0.8.1`	`>=3.6`, `<=3.9`
`1.7.1`	`0.7.2`	`>=3.6`, `<=3.9`
`1.7.0`	`0.7.0`	`>=3.6`, `<=3.8`
`1.6.0`	`0.6.0`	`>=3.6`, `<=3.8`
`1.5.0`	`0.5.0`	`>=3.5`, `<=3.8`
`1.4.0`	`0.4.0`	`==2.7`, `>=3.5`, `<=3.8`

安装预编译二进制文件¶

依赖项¶

可选依赖项¶

兼容性矩阵¶

文档

教程

资源