安装预编译二进制文件¶

torchaudio 为 PyPI (pip) 和 Anaconda (conda) 提供二进制发行版。

注意

每个 torchaudio 包都是针对特定版本的 torch 进行编译的。请参考下表，安装正确的 torch 和 torchaudio 组合。

注意

开始 0.10, torchaudio 有仅支持 CPU 和启用 CUDA 的二进制发行版, 每种都需要对应的 PyTorch 发行版。

注意

此软件是基于未修改的FFmpeg（根据LGPLv2.1许可）编译的，已移除特定的rpath以便使用系统库。LGPL源代码可以从这里下载。

依赖项¶

FFmpeg.

使用 torchaudio.io 模块所必需。 TorchAudio 官方二进制发行版兼容 FFmpeg 4.1 至 4.4。如果您需要使用 FFmpeg 5，请从源代码构建 TorchAudio。
sentencepiece

使用 Emformer RNN-T 执行自动语音识别所必需。
deep-phonemizer

执行文本转语音所需的 Tacotron2 文本转语音。
kaldi_io

需要使用 torchaudio.kaldi_io 模块。

TorchAudio 的官方二进制发行版包含用 C++ 编写的扩展模块，并链接到特定版本的 PyTorch。

不同版本的 TorchAudio 和 PyTorch 无法一起使用。请参考下表以获取对应的版本。