torchaudio.datasets¶
所有数据集都是 i.即,它们具有 和 实现的方法。
因此,它们都可以传递给 a
,后者可以使用 worker 并行加载多个样本。
例如:
__getitem__
__len__
torch.multiprocessing
yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(yesno_data,
batch_size=1,
shuffle=True,
num_workers=args.nThreads)
以下数据集可用:
所有数据集都有几乎相似的 API。它们都有两个常见的参数:分别转换 input 和 target。transform
target_transform
中国 CMUARCTIC¶
-
class (root: str, url: str = 'aew', folder_in_archive: str = 'ARCTIC', 下载: bool = False)[来源]
torchaudio.datasets.
CMUARCTIC
¶ 为 CMU_ARCTIC 创建 Dataset。
- 参数
root (str) – 找到或下载数据集的目录的路径。
url (str, optional) – 要从中下载数据集的 URL 或要下载的数据集的类型。 (默认值:) 允许的类型值为 、 或 。
"aew"
"aew"
"ahw"
"aup"
"awb"
"axb"
"bdl"
"clb"
"eey"
"fem"
"gka"
"jmk"
"ksp"
"ljm"
"lnh"
"rms"
"rxr"
"slp"
"slt"
folder_in_archive (str, optional) – 数据集的顶级目录。(默认:
"ARCTIC"
)download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
COMMONVOICE 公司¶
-
class (root: str, tsv: str = 'train.tsv', url: str = 'english', folder_in_archive: str = 'CommonVoice', version: str = 'cv-corpus-4-2019-12-10', 下载: bool = False)[来源]
torchaudio.datasets.
COMMONVOICE
¶ 为 CommonVoice 创建数据集。
- 参数
root (str) – 找到或下载数据集的目录的路径。
tsv (str, optional) – 用于构建元数据的 tsv 文件的名称。 (默认:
"train.tsv"
)url (str,可选) – 要从中下载数据集的 URL 或 要下载的数据集。(默认值:)。 允许的语言值为 、 、 、
"english"
"tatar"
"english"
"german"
"french"
"welsh"
"breton"
"chuvash"
"turkish"
"kyrgyz"
"irish"
"kabyle"
"catalan"
"taiwanese"
"slovenian"
"italian"
"dutch"
"hakha chin"
"esperanto"
"estonian"
"persian"
"portuguese"
"basque"
"spanish"
"chinese"
"mongolian"
"sakha"
"dhivehi"
"kinyarwanda"
"swedish"
"russian"
"indonesian"
"arabic"
"tamil"
"interlingua"
"latvian"
"japanese"
"votic"
"abkhaz"
"cantonese"
"romansh sursilvan"
folder_in_archive (str, optional) – 数据集的顶级目录。
version (str) – 版本字符串。(默认值:) 对于其他允许的值,请查看 https://commonvoice.mozilla.org/en/datasets。
"cv-corpus-4-2019-12-10"
download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
GTZAN 公司¶
-
class (root: str, url: str = 'http://opihi.cs.uvic.ca/sound/genres.tar.gz', folder_in_archive: str = 'genres', download: bool = False, subset: Optional[str] = None)[来源]
torchaudio.datasets.
GTZAN
¶ 为 GTZAN 创建一个数据集。
注意
如果您打算使用 http://marsyas.info/downloads/datasets.html 此数据集发布结果。
- 参数
root (str) – 找到或下载数据集的目录的路径。
url (str, optional) – 要从中下载数据集的 URL。 (默认:
"http://opihi.cs.uvic.ca/sound/genres.tar.gz"
)folder_in_archive (str, optional) – 数据集的顶级目录。
download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
subset (str, optional) (子集,可选) – 要使用的数据集子集。 、 或 之一。 如果 ,则使用整个数据集。(默认值:)。
"training"
"validation"
"testing"
None
None
None
LIBRISPEECH¶
-
类 (root: str, url: str = 'train-clean-100', folder_in_archive: str = 'LibriSpeech', 下载: bool = False)[来源]
torchaudio.datasets.
LIBRISPEECH
¶ 为 LibriSpeech 创建数据集。
- 参数
root (str) – 找到或下载数据集的目录的路径。
url (str, optional) – 要从中下载数据集的 URL, 或要下载的数据集的类型。 允许的类型值为 、 、 、 、 和 。(默认:
"dev-clean"
"dev-other"
"test-clean"
"test-other"
"train-clean-100"
"train-clean-360"
"train-other-500"
"train-clean-100"
)folder_in_archive (str, optional) – 数据集的顶级目录。(默认:
"LibriSpeech"
)download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
利布里茨¶
-
类 (root: str, url: str = 'train-clean-100', folder_in_archive: str = 'LibriTTS', 下载: bool = False)[来源]
torchaudio.datasets.
LIBRITTS
¶ 为 LibriTTS 创建一个数据集。
- 参数
root (str) – 找到或下载数据集的目录的路径。
url (str, optional) – 要从中下载数据集的 URL, 或要下载的数据集的类型。 允许的类型值为 、 、 、 、 和 。(默认:
"dev-clean"
"dev-other"
"test-clean"
"test-other"
"train-clean-100"
"train-clean-360"
"train-other-500"
"train-clean-100"
)folder_in_archive (str, optional) – 数据集的顶级目录。(默认:
"LibriTTS"
)download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
LJSPEECH¶
语音命令¶
特德利姆¶
VCTK¶
-
类(root: str, url: str = 'https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip', folder_in_archive: str = 'VCTK-Corpus', 下载: bool = False, 下采样: bool = False, 转换: Any = None, target_transform: Any = None)[来源]
torchaudio.datasets.
VCTK
¶ 创建 VCTK 数据集。
注意
directory 被忽略,因为没有相应的文本文件。 有关数据集的更多信息,请访问:https://datashare.is.ed.ac.uk/handle/10283/3443
p315
- 参数
root (str) – 找到或下载数据集的目录的路径。
url (str, optional) – 未使用,因为数据集不再公开可用。
folder_in_archive (str, optional) – 数据集的顶级目录。(默认:
"VCTK-Corpus"
)download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。 给予将导致错误,因为数据集不再是 公开可用。
False
download=True
downsample (bool, optional) (未使用)。
transform (callable, optional) (转换,可选) – 应用于波形的可选转换。(默认:
None
)target_transform (callable, optional) – 对话语应用的可选转换。(默认:
None
)
VCTK_092¶
-
class (root: str, mic_id: str = 'mic2', download: bool = False, url: str = 'https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip', audio_ext='.flac')[来源]
torchaudio.datasets.
VCTK_092
¶ 创建 VCTK 0.92 数据集
- 参数
root (str) – 找到数据集的顶级目录的根目录。
mic_id (str) – 麦克风 ID。(默认:
"mic1"
"mic2"
"mic2"
)download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
url (str, optional) – 要从中下载数据集的 URL。 (默认:
"https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip"
)audio_ext (str, optional) – 如果数据集转换为非默认音频格式,则为自定义音频扩展。
注意
由于缺少相应的文本文件,演讲者的所有演讲都将被跳过。
p315
由于缺少音频文件,所有语音都将被跳过。
p280
mic_id="mic2"
由于缺少音频文件,演讲者的一些演讲将被跳过。
p362
是的没有¶
-
类 (root: str, url: str = 'http://www.openslr.org/resources/1/waves_yesno.tar.gz', folder_in_archive: str = 'waves_yesno', 下载: bool = False, 转换: Any = None, target_transform: Any = None)[来源]
torchaudio.datasets.
YESNO
¶ 为 YesNo 创建 Dataset。
- 参数
root (str) – 找到或下载数据集的目录的路径。
url (str, optional) – 要从中下载数据集的 URL。 (默认:
"http://www.openslr.org/resources/1/waves_yesno.tar.gz"
)folder_in_archive (str, optional) – 数据集的顶级目录。(默认:
"waves_yesno"
)download (bool, optional) – 如果在根路径中找不到数据集,是否下载数据集。(默认值:)。
False
transform (callable, optional) (转换,可选) – 应用于波形的可选转换。(默认:
None
)target_transform (callable, optional) – 对话语应用的可选转换。(默认:
None
)