torchaudio.prototype.models¶
该分包包含用于解决常见音频任务的模型的定义。torchaudio.prototype.models
模型定义负责构建计算图并执行它们。
某些模型具有复杂的结构和变化。 对于此类模型,提供了工厂函数。
Conformer Wav2Vec2 预训练模型,用于从头开始训练。 |
|
实现 Streaming Transformer Transducer Based Speech Recognition Using Non-Causal Convolution [Shi et al., 2022] 中引入的卷积增强流式转换器架构。 |
|
HiFi GAN 的生成器部分 [Kong et al., 2020]。 |
beta 模型的原型工厂函数¶
一些模型定义处于 beta 阶段,但有一些新的工厂函数仍处于原型阶段。请检查每个模型中的 “Prototype Factory Functions” 部分。
wav2vec 2.0 中使用的声学模型 [Baevski et al., 2020]。 |
|
递归神经网络传感器 (RNN-T) 模型。 |