torchaudio.datasets¶
所有数据集都是 和 的子类 和 已实现的方法。
__getitem__
__len__
因此,它们都可以传递给 a,后者可以使用
worker 并行加载多个样本。
例如:
yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(
yesno_data,
batch_size=1,
shuffle=True,
num_workers=args.nThreads)
CMU ARCTIC [Kominek et al., 2003] 数据集。 |
|
CMU 发音词典 [Weide, 1998] (CMUDict) 数据集。 |
|
CommonVoice [Ardila et al., 2020] 数据集。 |
|
设备记录的 VCTK(小子集版本)[Sarfjoo 和 Yamagishi,2018] 数据集。 |
|
Fluent Speech Commands [Lugosch et al., 2019] 数据集 |
|
GTZAN [Tzanetakis et al., 2001] 数据集。 |
|
IEMOCAP [Busso et al., 2008] 数据集。 |
|
LibriMix [Cosentino et al., 2020] 数据集。 |
|
LibriSpeech [Panayotov et al., 2015] 数据集。 |
|
Libri-light 的子集 [Kahn et al., 2020] 数据集,用于 HuBERT [Hsu et al., 2021] 进行监督微调。 |
|
LibriTTS [Zen et al., 2019] 数据集。 |
|
LJSpeech-1.1 [Ito 和 Johnson,2017] 数据集。 |
|
MUSDB_HQ [Rafii et al., 2019] 数据集。 |
|
QUESST14 [Miro et al., 2015] 数据集。 |
|
Snips [Coucke et al., 2018] 数据集。 |
|
语音命令 [Warden, 2018] 数据集。 |
|
Tedlium [Rousseau et al., 2012] 数据集(版本 1、2 和 3)。 |
|
VCTK 0.92 [Yamagishi et al., 2019] 数据集 |
|
VoxCeleb1 [Nagrani et al., 2017] 数据集,用于说话人识别任务。 |
|
VoxCeleb1 [Nagrani et al., 2017] 数据集,用于说话人验证任务。 |
|
YesNo [YesNo, n.d.] 数据集。 |