目录

torchaudio.datasets

所有数据集都是torch.utils.data.Dataset并有和方法实施。__getitem____len__

因此,它们都可以传递给torch.utils.data.DataLoader可以使用torch.multiprocessing工人。 例如:

yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(
    yesno_data,
    batch_size=1,
    shuffle=True,
    num_workers=args.nThreads)

CMUARCTIC

CMU ARCTIC [Kominek et al., 2003] 数据集。

CMUDict

CMU 发音词典 [Weide, 1998] (CMUDict) 数据集。

COMMONVOICE

CommonVoice [Ardila et al., 2020] 数据集。

DR_VCTK

设备记录的 VCTK(小子集版本)[Sarfjoo 和 Yamagishi,2018] 数据集。

FluentSpeechCommands

Fluent Speech Commands [Lugosch et al., 2019] 数据集

GTZAN

GTZAN [Tzanetakis et al., 2001] 数据集。

IEMOCAP

IEMOCAP [Busso et al., 2008] 数据集。

LibriMix

LibriMix [Cosentino et al., 2020] 数据集。

LIBRISPEECH

LibriSpeech [Panayotov et al., 2015] 数据集。

LibriLightLimited

Libri-light 的子集 [Kahn et al., 2020] 数据集,用于 HuBERT [Hsu et al., 2021] 进行监督微调。

LIBRITTS

LibriTTS [Zen et al., 2019] 数据集。

LJSPEECH

LJSpeech-1.1 [Ito 和 Johnson,2017] 数据集。

MUSDB_HQ

MUSDB_HQ [Rafii et al., 2019] 数据集。

QUESST14

QUESST14 [Miro et al., 2015] 数据集。

Snips

Snips [Coucke et al., 2018] 数据集。

SPEECHCOMMANDS

语音命令 [Warden, 2018] 数据集。

TEDLIUM

Tedlium [Rousseau et al., 2012] 数据集(版本 1、2 和 3)。

VCTK_092

VCTK 0.92 [Yamagishi et al., 2019] 数据集

VoxCeleb1Identification

VoxCeleb1 [Nagrani et al., 2017] 数据集,用于说话人识别任务。

VoxCeleb1Verification

VoxCeleb1 [Nagrani et al., 2017] 数据集,用于说话人验证任务。

YESNO

YesNo [YesNo, n.d.] 数据集。

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源