目录

torchaudio.prototype.models

该分包包含用于解决常见音频任务的模型的定义。torchaudio.prototype.models

注意

对于带有预训练参数的模型,请参考 module。

模型定义负责构建计算图并执行它们。

某些模型具有复杂的结构和变化。 对于此类模型,提供了工厂函数。

ConformerWav2Vec2PretrainModel 模型

Conformer Wav2Vec2 预训练模型,用于从头开始训练。

ConvEmformer (凸凸凸透镜)

实现 Streaming Transformer Transducer Based Speech Recognition Using Non-Causal Convolution [Shi et al., 2022] 中引入的卷积增强流式转换器架构。

HiFiGANVocoder

HiFi GAN 的生成器部分 [Kong et al., 2020]。

beta 模型的原型工厂函数

一些模型定义处于 beta 阶段,但有一些新的工厂函数仍处于原型阶段。请检查每个模型中的 “Prototype Factory Functions” 部分。

Wav2Vec2模型

wav2vec 2.0 中使用的声学模型 [Baevski et al., 2020]。

RNNT

递归神经网络传感器 (RNN-T) 模型。

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源