目录

torchaudio.prototype.pipelines

pipelines 子包包含具有预训练权重和相关实用程序的模型的 API。

RNN-T 流/非流 ASR

预训练模型

EMFORMER_RNNT_BASE_MUSTC

预先训练的基于 Emformer-RNNT 的 ASR 管道,能够执行流式和非流式推理。

EMFORMER_RNNT_BASE_TEDLIUM3

预先训练的基于 Emformer-RNNT 的 ASR 管道,能够执行流式和非流式推理。

HiFiGAN 声码器

接口

定义了能够将梅尔频谱图转换为波形的 HiFiGAN Vocoder 管道。

HiFiGANVocoder捆绑包

捆绑相关信息以使用 pretrained 的数据类。

预训练模型

HIFIGAN_VOCODER_V3_LJSPEECH

HiFiGAN Vocoder 管道,在 LJ 语音数据集上训练 [Ito 和 Johnson,2017]。

VGGish

接口

VGGish捆绑包

VGGish [Hershey et al., 2017]torchvggishtensorflow 模型移植的推理管道。

VGGish捆绑.VGGish

VGGish 模型的实现 [Hershey et al., 2017]。

VGGishBundle.VGGishInputProcessor

将原始波形转换为批量示例,以用作 VGGish 的输入。

预训练模型

VGGISH

torchvggishtensorflow 模型移植的预训练 VGGish [Hershey et al., 2017] 推理管道。

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源