目录

安装预构建的二进制文件

torchaudio具有 PyPI () 和 Anaconda () 的二进制发行版。pipconda

详情请参阅 https://pytorch.org/get-started/locally/

注意

每个包都是针对特定版本的 进行编译的。 请参阅下表并安装正确的 和 对。torchaudiotorchtorchtorchaudio

注意

从 torchaudio 开始,具有仅限 CPU 和支持 CUDA 的二进制发行版, 每个 API 都需要相应的 PyTorch 发行版。0.10

注意

该软件是针对 FFmpeg 的未修改副本编译的,删除了特定的 rpath,以便能够使用系统库。LGPL 源代码可以从以下位置下载:n4.1.8许可证)、n5.0.3许可证)和 n6.0许可证)。

依赖

  • PyTorch 插件

    请参阅下面的兼容性矩阵,了解支持的 PyTorch 版本。

可选依赖项

  • FFmpeg

    需要使用 module。和 I/O 函数backend="ffmpeg"

    从版本 2.1 开始,TorchAudio 官方二进制发行版与 FFmpeg 版本 6、5 和 4。(>=4.4, <7)。在运行时,TorchAudio 首先查找 FFmpeg 6, 如果未找到,则它将继续查找 5 并继续查找 4。

    有多种方法可以安装 FFmpeg 库。 请参考官方文档了解如何安装 FFmpeg。 如果您使用的是 Anaconda Python 发行版,将安装 兼容的 FFmpeg 库。conda install -c conda-forge 'ffmpeg<7'

    如果需要指定 FFmpeg TorchAudio 搜索和链接的版本,可以 通过环境变量 指定它。例如 通过设置 ,TorchAudio 将只查找 FFmpeg 5.TORIO_USE_FFMPEG_VERSIONTORIO_USE_FFMPEG_VERSION=5

    如果由于某种原因,此搜索机制导致问题,您可以禁用 FFmpeg 集成完全通过设置环境变量 .TORIO_USE_FFMPEG=0

    有多种方法可以安装 FFmpeg 库。 如果您使用的是 Anaconda Python 发行版,将安装 兼容的 FFmpeg 库。conda install -c conda-forge 'ffmpeg<7'

    注意

    搜索 FFmpeg 安装时,TorchAudio 会查找库文件 其名称包含版本号。 也就是说,对于 Linux、macOS 和 Windows。 许多公共预构建二进制文件都遵循此命名方案,但一些发行版 具有未版本控制的文件名。 如果您在检测 FFmpeg 时遇到困难,请仔细检查库 您安装的文件遵循此命名方案(然后确保 它们位于 Library Search Path 中列出的目录之一。libavutil.so.<VERSION>libavutil.<VERSION>.dylibavutil-<VERSION>.dll

  • 袜 队

    I/O 函数中使用时需要。backend="sox"

    从版本 2.1 开始,TorchAudio 需要单独安装 libsox。

    如果动态链接导致问题,您可以设置环境变量 ,并且 TorchAudio 不会使用 SoX。TORCHAUDIO_USE_SOX=0

    注意

    TorchAudio 查找名称未版本控制的库文件,该文件适用于 Linux 和 macOS。某些包管理器会安装该库 文件。例如,Ubuntu 上的 aptitude 会安装 . 要让 TorchAudio 链接到它,你可以创建一个带有 name 的符号链接(并将符号链接放在库搜索路径中)。libsox.solibsox.dyliblibsox.so.3libsox.so

    注意

    TorchAudio 在 libsox 14.4.2 上进行了测试。(而且其他 版本会起作用。

  • 声音文件

    I/O 函数中使用时需要。backend="soundfile"

  • 句子

    使用 Emformer RNN-T 执行自动语音识别时需要。 您可以通过运行 来安装它。pip install sentencepiece

  • deep-phonemizer

    使用 Tacotron2 Text-To-Speech 执行文本转语音时需要。

  • kaldi_io

    需要使用 module。

兼容性矩阵

TorchAudio 的官方二进制发行版包含扩展模块 它们是用 C++ 编写的,并与特定版本的 PyTorch 链接。

不同版本的 TorchAudio 和 PyTorch 不能一起使用。 请参阅下表了解匹配的版本。

PyTorch

TorchAudio

Python

2.1.0

2.1.0

>=3.8,<=3.11

2.0.1

2.0.2

>=3.8,<=3.11

2.0.0

2.0.1

>=3.8,<=3.11

1.13.1

0.13.1

>=3.7,<=3.10

1.13.0

0.13.0

>=3.7,<=3.10

1.12.1

0.12.1

>=3.7,<=3.10

1.12.0

0.12.0

>=3.7,<=3.10

1.11.0

0.11.0

>=3.7,<=3.9

1.10.0

0.10.0

>=3.6,<=3.9

1.9.1

0.9.1

>=3.6,<=3.9

1.8.1

0.8.1

>=3.6,<=3.9

1.7.1

0.7.2

>=3.6,<=3.9

1.7.0

0.7.0

>=3.6,<=3.8

1.6.0

0.6.0

>=3.6,<=3.8

1.5.0

0.5.0

>=3.5,<=3.8

1.4.0

0.4.0

==2.7, ,>=3.5<=3.8

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源