安装预构建的二进制文件¶

torchaudio具有 PyPI （）和 Anaconda （）的二进制发行版。pipconda

详情请参阅 https://pytorch.org/get-started/locally/。

注意

每个包都是针对特定版本的进行编译的。请参阅下表并安装正确的和对。torchaudiotorchtorchtorchaudio

注意

从 torchaudio 开始，具有仅限 CPU 和支持 CUDA 的二进制发行版，每个 API 都需要相应的 PyTorch 发行版。0.10

注意

该软件是针对 FFmpeg 的未修改副本编译的，删除了特定的 rpath，以便能够使用系统库。LGPL 源代码可以从以下位置下载：n4.1.8（许可证）、n5.0.3（许可证）和 n6.0（许可证）。

依赖¶

PyTorch 插件

请参阅下面的兼容性矩阵，了解支持的 PyTorch 版本。

可选依赖项¶

FFmpeg

需要使用torchaudio.io模块。和 I/O 函数。backend="ffmpeg"

从版本 2.1 开始，TorchAudio 官方二进制发行版与 FFmpeg 版本 6、5 和 4。（>=4.4， <7）。在运行时，TorchAudio 首先查找 FFmpeg 6，如果未找到，则它将继续查找 5 并继续查找 4。

有多种方法可以安装 FFmpeg 库。请参考官方文档了解如何安装 FFmpeg。如果您使用的是 Anaconda Python 发行版，将安装兼容的 FFmpeg 库。conda install -c conda-forge 'ffmpeg<7'

如果需要指定 FFmpeg TorchAudio 搜索和链接的版本，可以通过环境变量指定它。例如通过设置，TorchAudio 将只查找 FFmpeg 5.TORIO_USE_FFMPEG_VERSIONTORIO_USE_FFMPEG_VERSION=5

如果由于某种原因，此搜索机制导致问题，您可以禁用 FFmpeg 集成完全通过设置环境变量 .TORIO_USE_FFMPEG=0

有多种方法可以安装 FFmpeg 库。如果您使用的是 Anaconda Python 发行版，将安装兼容的 FFmpeg 库。conda install -c conda-forge 'ffmpeg<7'

注意

搜索 FFmpeg 安装时，TorchAudio 会查找库文件其名称包含版本号。也就是说，对于 Linux、macOS 和 Windows。许多公共预构建二进制文件都遵循此命名方案，但一些发行版具有未版本控制的文件名。如果您在检测 FFmpeg 时遇到困难，请仔细检查库您安装的文件遵循此命名方案（然后确保它们位于 Library Search Path 中列出的目录之一。libavutil.so.<VERSION>libavutil.<VERSION>.dylibavutil-<VERSION>.dll
袜队

在 I/O 函数中使用时需要。backend="sox"

从版本 2.1 开始，TorchAudio 需要单独安装 libsox。

如果动态链接导致问题，您可以设置环境变量，并且 TorchAudio 不会使用 SoX。TORCHAUDIO_USE_SOX=0

注意

TorchAudio 查找名称未版本控制的库文件，该文件适用于 Linux 和 macOS。某些包管理器会安装该库文件。例如，Ubuntu 上的 aptitude 会安装 . 要让 TorchAudio 链接到它，你可以创建一个带有 name 的符号链接（并将符号链接放在库搜索路径中）。libsox.solibsox.dyliblibsox.so.3libsox.so

注意

TorchAudio 在 libsox 14.4.2 上进行了测试。（而且其他版本会起作用。
声音文件

在 I/O 函数中使用时需要。backend="soundfile"
句子

使用 Emformer RNN-T 执行自动语音识别时需要。您可以通过运行来安装它。pip install sentencepiece
deep-phonemizer

使用 Tacotron2 Text-To-Speech 执行文本转语音时需要。
kaldi_io

需要使用torchaudio.kaldi_io模块。

兼容性矩阵¶

TorchAudio 的官方二进制发行版包含扩展模块它们是用 C++ 编写的，并与特定版本的 PyTorch 链接。

不同版本的 TorchAudio 和 PyTorch 不能一起使用。请参阅下表了解匹配的版本。

`PyTorch`	`TorchAudio`	`Python`
`2.1.0`	`2.1.0`	`>=3.8`,`<=3.11`
`2.0.1`	`2.0.2`	`>=3.8`,`<=3.11`
`2.0.0`	`2.0.1`	`>=3.8`,`<=3.11`
`1.13.1`	`0.13.1`	`>=3.7`,`<=3.10`
`1.13.0`	`0.13.0`	`>=3.7`,`<=3.10`
`1.12.1`	`0.12.1`	`>=3.7`,`<=3.10`
`1.12.0`	`0.12.0`	`>=3.7`,`<=3.10`
`1.11.0`	`0.11.0`	`>=3.7`,`<=3.9`
`1.10.0`	`0.10.0`	`>=3.6`,`<=3.9`
`1.9.1`	`0.9.1`	`>=3.6`,`<=3.9`
`1.8.1`	`0.8.1`	`>=3.6`,`<=3.9`
`1.7.1`	`0.7.2`	`>=3.6`,`<=3.9`
`1.7.0`	`0.7.0`	`>=3.6`,`<=3.8`
`1.6.0`	`0.6.0`	`>=3.6`,`<=3.8`
`1.5.0`	`0.5.0`	`>=3.5`,`<=3.8`
`1.4.0`	`0.4.0`	`==2.7`, ,`>=3.5<=3.8`

安装预构建的二进制文件¶

依赖¶

可选依赖项¶

兼容性矩阵¶

文档

教程

资源