torchaudio.datasets¶
所有数据集都是 和 的子类 和 已实现的方法。
因此,它们都可以传递给 a
,后者可以使用 worker 并行加载多个样本。
例如:
__getitem__
__len__
torch.multiprocessing
yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(yesno_data,
batch_size=1,
shuffle=True,
num_workers=args.nThreads)
中国 CMUARCTIC¶
-
类 (根: Union[str, pathlib.Path], url: str = 'aew', folder_in_archive: str = 'ARCTIC', 下载: bool = False)[来源]
torchaudio.datasets.
CMUARCTIC
¶ 为 CMU_ARCTIC 创建 Dataset。
- 参数
root (str 或 Path) – 找到或下载数据集的目录的路径。
url (str, optional) – 要从中下载数据集的 URL 或要下载的数据集的类型。 (默认值:) 允许的类型值为 、 或 。
"aew"
"aew"
"ahw"
"aup"
"awb"
"axb"
"bdl"
"clb"
"eey"
"fem"
"gka"
"jmk"
"ksp"
"ljm"
"lnh"
"rms"
"rxr"
"slp"
"slt"
folder_in_archive (str, optional) – 数据集的顶级目录。(默认:
"ARCTIC"
)download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
CMUDict¶
-
类 (根: Union[str, pathlib.Path], exclude_punctuations: bool = True, *, download: bool = False, url: str = 'http://svn.code.sf.net/p/cmusphinx/code/trunk/cmudict/cmudict-0.7b', url_symbols: str = 'http://svn.code.sf.net/p/cmusphinx/code/trunk/cmudict/cmudict-0.7b.symbols')[来源]
torchaudio.datasets.
CMUDict
¶ 为 CMU 发音词典 (CMUDict) 创建数据集。
- 参数
root (str 或 Path) – 找到或下载数据集的目录的路径。
exclude_punctuations (bool, optional) – 启用后,排除标点符号的发音,例如 !感叹号和 #HASH 标记。
download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
url (str, optional) – 要从中下载词典的 URL。 (默认:
"http://svn.code.sf.net/p/cmusphinx/code/trunk/cmudict/cmudict-0.7b"
)url_symbols (str, optional) – 要从中下载元件列表的 URL。 (默认:
"http://svn.code.sf.net/p/cmusphinx/code/trunk/cmudict/cmudict-0.7b.symbols"
)
COMMONVOICE 公司¶
-
类 (根: Union[str, pathlib.路径], tsv: str = 'train.tsv')[来源]
torchaudio.datasets.
COMMONVOICE
¶ 为 CommonVoice 创建数据集。
- 参数
GTZAN 公司¶
-
类 (根: Union[str, pathlib.Path], url: str = 'http://opihi.cs.uvic.ca/sound/genres.tar.gz', folder_in_archive: str = 'genres', 下载: bool = False,子集:可选[str] = None)[来源]
torchaudio.datasets.
GTZAN
¶ 为 GTZAN 创建一个数据集。
注意
如果您打算使用 http://marsyas.info/downloads/datasets.html 此数据集发布结果。
- 参数
root (str 或 Path) – 找到或下载数据集的目录的路径。
url (str, optional) – 要从中下载数据集的 URL。 (默认:
"http://opihi.cs.uvic.ca/sound/genres.tar.gz"
)folder_in_archive (str, optional) – 数据集的顶级目录。
download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
subset (str 或 None,可选) – 要使用的数据集子集。 、 或 之一。 如果 ,则使用整个数据集。(默认值:)。
"training"
"validation"
"testing"
None
None
None
LIBRISPEECH¶
-
类 (根: Union[str, pathlib.Path], url: str = 'train-clean-100', folder_in_archive: str = 'LibriSpeech', 下载: 布尔 = False)[来源]
torchaudio.datasets.
LIBRISPEECH
¶ 为 LibriSpeech 创建数据集。
- 参数
root (str 或 Path) – 找到或下载数据集的目录的路径。
url (str, optional) – 要从中下载数据集的 URL, 或要下载的数据集的类型。 允许的类型值为 、 、 、 、 和 。(默认:
"dev-clean"
"dev-other"
"test-clean"
"test-other"
"train-clean-100"
"train-clean-360"
"train-other-500"
"train-clean-100"
)folder_in_archive (str, optional) – 数据集的顶级目录。(默认:
"LibriSpeech"
)download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
利布里茨¶
-
类 (根: Union[str, pathlib.Path], url: str = 'train-clean-100', folder_in_archive: str = 'LibriTTS', 下载: bool = False)[来源]
torchaudio.datasets.
LIBRITTS
¶ 为 LibriTTS 创建一个数据集。
- 参数
root (str 或 Path) – 找到或下载数据集的目录的路径。
url (str, optional) – 要从中下载数据集的 URL, 或要下载的数据集的类型。 允许的类型值为 、 、 、 、 和 。(默认:
"dev-clean"
"dev-other"
"test-clean"
"test-other"
"train-clean-100"
"train-clean-360"
"train-other-500"
"train-clean-100"
)folder_in_archive (str, optional) – 数据集的顶级目录。(默认:
"LibriTTS"
)download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
LJSPEECH¶
语音命令¶
-
类 (根: Union[str, pathlib.Path], url: str = 'speech_commands_v0.02', folder_in_archive: str = 'SpeechCommands', 下载: 布尔 = False,子集:可选[str] = None)[来源]
torchaudio.datasets.
SPEECHCOMMANDS
¶ 为 Speech 命令创建 Dataset。
- 参数
root (str 或 Path) – 找到或下载数据集的目录的路径。
url (str, optional) – 要从中下载数据集的 URL, 或要下载的数据集的类型。 允许的类型值为 和 (默认值:
"speech_commands_v0.01"
"speech_commands_v0.02"
"speech_commands_v0.02"
)folder_in_archive (str, optional) – 数据集的顶级目录。(默认:
"SpeechCommands"
)download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
subset (str 或 None,可选) – 选择数据集的子集 [None, “training”, “validation”, “testing”]。None 表示 整个数据集。“validation” 和 “testing” 在 “validation_list.txt” 和 分别是 “testing_list.txt”,其余的则是 “training”。文件的详细信息 “validation_list.txt”和“testing_list.txt”在数据集的 README 中进行了解释 以及原始论文第 7 节及其参考文献 12 的引言。这 原始论文可以在这里找到。(默认:
None
)
特德利姆¶
-
类 (根: Union[str, pathlib.Path], release: str = 'release1', subset: Optional[str] = None, 下载: bool = False, audio_ext: str = '.sph')[来源]
torchaudio.datasets.
TEDLIUM
¶ 为 Tedlium 创建 Dataset。它支持版本 1、2 和 3。
- 参数
root (str 或 Path) – 找到或下载数据集的目录的路径。
release (str, optional) – 发行版。 允许的值为 , 或 。 (默认值:)。
"release1"
"release2"
"release3"
"release1"
subset (str, optional) (子集,可选) – 要使用的数据集子集。有效选项包括 、 、 对于版本 1&2,对于版本 3。默认为 或 。
"train"
"dev"
"test"
None
"train"
None
download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
audio_ext (str, optional) – 音频文件的扩展名 (默认:
"audio_ext"
)
VCTK¶
-
类 (根: Union[str, pathlib.Path], url: str = 'https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip', folder_in_archive: str = 'VCTK-Corpus', 下载:bool = False,下采样:bool = False)[来源]
torchaudio.datasets.
VCTK
¶ 创建 VCTK 数据集。
注意
directory 被忽略,因为没有相应的文本文件。 有关数据集的更多信息,请访问:https://datashare.is.ed.ac.uk/handle/10283/3443
p315
- 参数
VCTK_092¶
-
class (root: str, mic_id: str = 'mic2', 下载: bool = False, 网址: str = 'https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip', audio_ext='.flac')[来源]
torchaudio.datasets.
VCTK_092
¶ 创建 VCTK 0.92 数据集
- 参数
root (str) – 找到数据集的顶级目录的根目录。
mic_id (str, optional) – 麦克风 ID。(默认:
"mic1"
"mic2"
"mic2"
)download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
url (str, optional) – 要从中下载数据集的 URL。 (默认:
"https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip"
)audio_ext (str, optional) – 如果数据集转换为非默认音频格式,则为自定义音频扩展。
注意
由于缺少相应的文本文件,演讲者的所有演讲都将被跳过。
p315
由于缺少音频文件,所有语音都将被跳过。
p280
mic_id="mic2"
由于缺少音频文件,演讲者的一些演讲将被跳过。
p362