torchaudio.prototype.models¶
torchaudio.prototype.models 子包包含用于解决常见音频任务的模型定义。
注意
对于具有预训练参数的模型,请参阅 torchaudio.prototype.pipelines 模块。
模型定义负责构建计算图并执行它们。
某些模型具有复杂的结构和变体。 针对此类模型,提供了工厂函数。
用于从头训练的 Conformer Wav2Vec2 预训练模型。 |
|
实现了在 Streaming Transformer Transducer based Speech Recognition Using Non-Causal Convolution 中介绍的卷积增强流式 Transformer 架构 [Shi et al., 2022]。 |
|
Generator 部分的 HiFi GAN [Kong et al., 2020]. |
Beta 模型的原型工厂函数¶
部分模型定义处于测试阶段,但仍有新的工厂函数仍处于原型阶段。请查看每个模型中的“原型工厂函数”部分。
wav2vec 2.0中使用的声学模型 [Baevski et al., 2020]。 |
|
循环神经网络转换器(RNN-T)模型。 |