安装预编译二进制文件¶
torchaudio 为 PyPI (pip) 和 Anaconda (conda) 提供二进制发行版。
请参考 https://pytorch.org/get-started/locally/ 了解详细信息。
注意
每个 torchaudio 包都是针对特定版本的 torch 进行编译的。
请参考下表,安装正确的 torch 和 torchaudio 组合。
注意
开始 0.10, torchaudio 有仅支持 CPU 和启用 CUDA 的二进制发行版,
每种都需要对应的 PyTorch 发行版。
依赖项¶
-
请参考下表中的兼容性矩阵,了解支持的 PyTorch 版本。
可选依赖项¶
-
使用
torchaudio.io模块所必需。 TorchAudio 官方二进制发行版兼容 FFmpeg 4.1 至 4.4。 如果您需要使用 FFmpeg 5,请从源代码构建 TorchAudio。 -
使用 Emformer RNN-T 执行自动语音识别所必需。
-
执行文本转语音所需的 Tacotron2 文本转语音。
-
需要使用
torchaudio.kaldi_io模块。
兼容性矩阵¶
TorchAudio 的官方二进制发行版包含用 C++ 编写的扩展模块,并链接到特定版本的 PyTorch。
不同版本的 TorchAudio 和 PyTorch 无法一起使用。 请参考下表以获取对应的版本。
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|