Torchaudio¶

I/O （输入输出）¶

torchaudio顶级模块提供了以下功能，使它很容易处理音频数据。

解码和编码媒体是一个高度复杂的过程。因此，TorchAudio 依赖第三方库来执行这些作。这些第三方库称为，目前 TorchAudio 集成了关注库。backend

有关如何启用后端的信息，请参阅安装。

传统上， TorchAudio 在运行时全局设置其 I/O 后端视情况而定。但是，此方法不允许应用程序使用不同的后端，它不太适合大型代码库。

出于这些原因，在 v2.0 中，我们引入了一个 Dispatcher，这是一种允许 users 为每个函数调用选择一个后端。

启用调度程序模式后，所有 I/O 函数都接受额外的 keyward 参数，该参数指定所需的后端。如果指定了 backend 不可用，则函数调用将失败。backend

如果未明确选择后端，则函数将选择要使用给定的优先级顺序和库可用性的后端。

下表总结了后端。

优先权

后端

支持的作系统

注意

1

FFmpeg

Linux、macOS、Windows

此后端支持各种协议，例如 HTTPS 和 MP4，以及类似文件的对象。

2

袜队

Linux、macOS

此后端不支持类似文件的对象。

3

声音文件

Linux、macOS、Windows

有关支持的编解码器，请参阅官方文档。

此后端支持类似文件的对象。

我们正在迁移 I/O 函数以使用 Dispatcher 机制，并且此引发多个更改，其中一些涉及向后兼容性破坏更改，并要求用户更改其函数调用。

（计划的）更改如下。有关最新信息，请参阅 https://github.com/pytorch/audio/issues/2950

在 2.0 中，引入了音频 I/O 后端调度程序。用户可以通过设置环境变量来选择使用 dispatcher 。TORCHAUDIO_USE_BACKEND_DISPATCHER=1
在 2.1 中，disptcher 成为 I/O 的默认机制。
在 2.2 中，删除了传统的全局后端机制。 Utility 函数并变为 no-op。get_audio_backend()set_audio_backend()

此外，我们从 libsox 后端中删除了类文件对象支持，因为由 FFmpeg 后端更好地支持，并使构建过程更简单。因此，从 2.1 开始，FFmpeg 和 Soundfile 是唯一支持 file-like 对象。