安装预构建的二进制文件¶
torchaudio
具有 PyPI () 和 Anaconda () 的二进制发行版。pip
conda
详情请参阅 https://pytorch.org/get-started/locally/。
注意
每个包都是针对特定版本的 进行编译的。
请参阅下表并安装正确的 和 对。torchaudio
torch
torch
torchaudio
注意
从 torchaudio 开始,具有仅限 CPU 和支持 CUDA 的二进制发行版,
每个 API 都需要相应的 PyTorch 发行版。0.10
注意
该软件是针对 FFmpeg 的未修改副本编译的,删除了特定的 rpath,以便能够使用系统库。LGPL 源代码可以从以下位置下载:n4.1.8(许可证)、n5.0.3(许可证)和 n6.0(许可证)。
依赖¶
-
请参阅下面的兼容性矩阵,了解支持的 PyTorch 版本。
可选依赖项¶
-
需要使用
module。和 I/O 函数。
backend="ffmpeg"
从版本 2.1 开始,TorchAudio 官方二进制发行版与 FFmpeg 版本 6、5 和 4。(>=4.4, <7)。在运行时,TorchAudio 首先查找 FFmpeg 6, 如果未找到,则它将继续查找 5 并继续查找 4。
有多种方法可以安装 FFmpeg 库。 请参考官方文档了解如何安装 FFmpeg。 如果您使用的是 Anaconda Python 发行版,将安装 兼容的 FFmpeg 库。
conda install -c conda-forge 'ffmpeg<7'
如果需要指定 FFmpeg TorchAudio 搜索和链接的版本,可以 通过环境变量 指定它。例如 通过设置 ,TorchAudio 将只查找 FFmpeg 5.
TORIO_USE_FFMPEG_VERSION
TORIO_USE_FFMPEG_VERSION=5
如果由于某种原因,此搜索机制导致问题,您可以禁用 FFmpeg 集成完全通过设置环境变量 .
TORIO_USE_FFMPEG=0
有多种方法可以安装 FFmpeg 库。 如果您使用的是 Anaconda Python 发行版,将安装 兼容的 FFmpeg 库。
conda install -c conda-forge 'ffmpeg<7'
注意
搜索 FFmpeg 安装时,TorchAudio 会查找库文件 其名称包含版本号。 也就是说,对于 Linux、macOS 和 Windows。 许多公共预构建二进制文件都遵循此命名方案,但一些发行版 具有未版本控制的文件名。 如果您在检测 FFmpeg 时遇到困难,请仔细检查库 您安装的文件遵循此命名方案(然后确保 它们位于 Library Search Path 中列出的目录之一。
libavutil.so.<VERSION>
libavutil.<VERSION>.dylib
avutil-<VERSION>.dll
-
在 I/O 函数中使用时需要。
backend="sox"
从版本 2.1 开始,TorchAudio 需要单独安装 libsox。
如果动态链接导致问题,您可以设置环境变量 ,并且 TorchAudio 不会使用 SoX。
TORCHAUDIO_USE_SOX=0
注意
TorchAudio 查找名称未版本控制的库文件,该文件适用于 Linux 和 macOS。某些包管理器会安装该库 文件。例如,Ubuntu 上的 aptitude 会安装 . 要让 TorchAudio 链接到它,你可以创建一个带有 name 的符号链接(并将符号链接放在库搜索路径中)。
libsox.so
libsox.dylib
libsox.so.3
libsox.so
注意
TorchAudio 在 libsox 14.4.2 上进行了测试。(而且其他 版本会起作用。
-
在 I/O 函数中使用时需要。
backend="soundfile"
-
使用 Emformer RNN-T 执行自动语音识别时需要。 您可以通过运行 来安装它。
pip install sentencepiece
-
使用 Tacotron2 Text-To-Speech 执行文本转语音时需要。
兼容性矩阵¶
TorchAudio 的官方二进制发行版包含扩展模块 它们是用 C++ 编写的,并与特定版本的 PyTorch 链接。
不同版本的 TorchAudio 和 PyTorch 不能一起使用。 请参阅下表了解匹配的版本。
|
|
|
---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|