torchaudio.prototype.pipelines¶
pipelines 子包包含具有预训练权重和相关实用程序的模型的 API。
RNN-T 流/非流 ASR¶
预训练模型¶
预先训练的基于 Emformer-RNNT 的 ASR 管道,能够执行流式和非流式推理。 |
|
预先训练的基于 Emformer-RNNT 的 ASR 管道,能够执行流式和非流式推理。 |
HiFiGAN 声码器¶
接口¶
定义了能够将梅尔频谱图转换为波形的 HiFiGAN Vocoder 管道。
预训练模型¶
HiFiGAN Vocoder 管道,在 LJ 语音数据集上训练 [Ito 和 Johnson,2017]。 |
VGGish¶
接口¶
VGGish [Hershey et al., 2017] 从 torchvggish 和 tensorflow 模型移植的推理管道。 |
|
VGGish 模型的实现 [Hershey et al., 2017]。 |
|
将原始波形转换为批量示例,以用作 VGGish 的输入。 |
预训练模型¶
从 torchvggish 和 tensorflow 模型移植的预训练 VGGish [Hershey et al., 2017] 推理管道。 |