Torchaudio 文档¶
Torchaudio 是一个使用 PyTorch 进行音频和信号处理的库。 它提供 I/O、信号和数据处理功能、数据集、 模型实现和应用程序组件。
本文档中描述的功能按版本状态分类:
稳定:这些功能将长期维护,通常应该有 在文档中没有重大的性能限制或差距。 我们还希望保持向后兼容性(尽管 可能会发生重大更改,并且将提前一个版本发出通知 的时间)。
试用版:功能被标记为 Beta 版,因为 API 可能会根据 用户反馈,因为性能需要改进,或者因为 跨 Operators 的覆盖范围尚未完成。对于 Beta 版功能,我们是 致力于将该功能一直持续到 Stable 分类。 但是,我们并不承诺向后兼容。
原型:这些功能通常不作为 PyPI 或 Conda 等二进制发行版,但有时落后于运行时 标志,并且处于反馈和测试的早期阶段。
API 参考¶
引用 torchaudio¶
如果您觉得 torchaudio 有用,请引用以下论文:
Yang, Y.-Y., Hira, M., Ni, Z., Chourdia, A., Astafurov, A., Chen, C., Yeh, C.-F., Puhrsch, C., 波拉克,D.,根泽尔,D.,格林伯格,D.,杨,EZ,连,J.,Mahadeokar,J.,黄,J., 陈,J.,戈尔兹伯勒,P.,罗伊,P.,纳伦蒂兰,S.,渡边,S.,钦塔拉,S., Quenneville-Bélair, V, & Shi, Y. (2021)。 TorchAudio:音频和语音处理的构建块。arXiv 预印本 arXiv:2110.15018。
在 BibTeX 格式中:
@article{yang2021torchaudio,
title={TorchAudio: Building Blocks for Audio and Speech Processing},
author={Yao-Yuan Yang and Moto Hira and Zhaoheng Ni and
Anjali Chourdia and Artyom Astafurov and Caroline Chen and
Ching-Feng Yeh and Christian Puhrsch and David Pollack and
Dmitriy Genzel and Donny Greenberg and Edward Z. Yang and
Jason Lian and Jay Mahadeokar and Jeff Hwang and Ji Chen and
Peter Goldsborough and Prabhat Roy and Sean Narenthiran and
Shinji Watanabe and Soumith Chintala and
Vincent Quenneville-Bélair and Yangyang Shi},
journal={arXiv preprint arXiv:2110.15018},
year={2021}
}