数据集¶

Torchvision 提供了许多内置数据集在 torchvision.datasets 模块中，以及用于构建您自己的数据集的实用程序类。

内置数据集¶

所有数据集都是 torch.utils.data.Dataset 的子类，即，它们实现了 __getitem__ 和 __len__ 方法。因此，它们都可以传递给一个 torch.utils.data.DataLoader，该对象可以使用 torch.multiprocessing 个工作者并行加载多个样本。例如：

imagenet_data = torchvision.datasets.ImageNet('path/to/imagenet_root/')
data_loader = torch.utils.data.DataLoader(imagenet_data,
                                          batch_size=4,
                                          shuffle=True,
                                          num_workers=args.nThreads)

所有数据集的API几乎相同。它们都有两个通用参数： transform 和 target_transform 分别用于转换输入和目标。您还可以使用提供的基类创建自己的数据集。

图像分类¶

`Caltech101`(根目录[, 目标类型, 变换, ...])	Caltech 101 数据集。
`Caltech256`(根目录[, 变换, ...])	Caltech 256 数据集。
`CelebA`(root[, split, target_type, ...])	大规模名人面部属性（CelebA）数据集数据集。
`CIFAR10`(root[, train, transform, ...])	CIFAR10 Dataset.
`CIFAR100`(root[, train, transform, ...])	CIFAR100 Dataset.
`Country211`(根目录[，拆分，转换，...])	Country211数据集来自OpenAI。
`DTD`(root[, split, partition, transform, ...])	可描述纹理数据集 (DTD).
`EMNIST`(root, split, **kwargs)	EMNIST Dataset.
`EuroSAT`(root[, transform, target_transform, ...])	RGB版本的EuroSAT数据集。
`FakeData`([size, image_size, num_classes, ...])	一个返回随机生成图像的假数据集，并将其作为PIL图像返回。
`FashionMNIST`(root[, train, transform, ...])	Fashion-MNIST Dataset.
`FER2013`(root[, split, transform, ...])	FER2013 Dataset.
`FGVCAircraft`(root[, split, ...])	FGVC Aircraft 数据集。
`Flickr8k`(根目录, ann_file[, transform, ...])	Flickr8k 实体数据集。
`Flickr30k`(根目录, ann_file[, transform, ...])	Flickr30k 实体数据集。
`Flowers102`(根目录[，拆分，转换，...])	牛津102花卉数据集。
`Food101`(根目录[，拆分，转换，...])	Food-101数据集.
`GTSRB`(root[, split, transform, ...])	德国交通标志识别基准 (GTSRB) 数据集。
`INaturalist`(root[, version, target_type, ...])	iNaturalist Dataset.
`ImageNet`(root[, split])	ImageNet 2012 分类数据集。
`KMNIST`(root[, train, transform, ...])	Kuzushiji-MNIST Dataset.
`LFWPeople`(root[, split, image_set, ...])	LFW Dataset.
`LSUN`(root[, classes, transform, ...])	LSUN dataset.
`MNIST`(root[, train, transform, ...])	MNIST Dataset.
`Omniglot`(根目录[，背景，变换，...])	Omniglot 数据集。
`OxfordIIITPet`(root[, split, target_types, ...])	牛津-印度理工学院宠物数据集.
`Places365`(根目录, 拆分, 小, 下载, ...)	Places365 分类数据集。
`PCAM`(root[, split, transform, ...])	PCAM数据集.
`QMNIST`(root[, what, compat, train])	QMNIST Dataset.
`RenderedSST2`(root[, split, transform, ...])	渲染后的SST2数据集.
`SEMEION`(root[, transform, target_transform, ...])	SEMEION Dataset.
`SBU`(root[, transform, target_transform, ...])	SBU 标注照片数据集。
`StanfordCars`(root[, split, transform, ...])	斯坦福汽车数据集
`STL10`(root[, split, folds, transform, ...])	STL10 Dataset.
`SUN397`(root[, transform, target_transform, ...])	SUN397数据集.
`SVHN`(root[, split, transform, ...])	SVHN Dataset.
`USPS`(root[, train, transform, ...])	USPS Dataset.

图像检测或分割¶

`CocoDetection`(root, annFile[, transform, ...])	MS Coco Detection 数据集。
`CelebA`(root[, split, target_type, ...])	大规模名人面部属性（CelebA）数据集数据集。
`Cityscapes`(根目录[, 拆分, 模式, 目标类型, ...])	城市景观数据集。
`GTSRB`(root[, split, transform, ...])	德国交通标志识别基准 (GTSRB) 数据集。
`Kitti`(根目录[，训练，变换，...])	KITTI Dataset.
`OxfordIIITPet`(root[, split, target_types, ...])	牛津-印度理工学院宠物数据集.
`SBDataset`(root[, image_set, mode, download, ...])	语义边界数据集
`VOCSegmentation`(root[, year, image_set, ...])	Pascal VOC 分割数据集。
`VOCDetection`(root[, year, image_set, ...])	Pascal VOC 目标检测数据集。
`WIDERFace`(root[, split, transform, ...])	WIDERFace Dataset.

光流¶

`FlyingChairs`(root[, split, transforms])	FlyingChairs 数据集用于光流。
`FlyingThings3D`(root[, split, pass_name, ...])	FlyingThings3D 数据集用于光流。
`HD1K`(root[, split, transforms])	HD1K 数据集用于光流。
`KittiFlow`(root[, split, transforms])	KITTI 数据集用于光流（2015）。
`Sintel`(根目录[，拆分，传递名称，变换])	Sintel 数据集用于光流。

立体匹配¶

`CarlaStereo`(root[, transforms])	Carla模拟器数据链接在CREStereo github仓库中。
`Kitti2012Stereo`(root[, split, transforms])	KITTI数据集来自2012年立体评估基准。
`Kitti2015Stereo`(root[, split, transforms])	KITTI数据集来自2015年立体评估基准。
`CREStereo`(root[, transforms])	用于训练CREStereo架构的合成数据集。
`FallingThingsStereo`(root[, variant, transforms])	FallingThings dataset.
`SceneFlowStereo`(root[, variant, pass_name, ...])	数据集接口用于Scene Flow数据集。
`SintelStereo`(root[, pass_name, transforms])	Sintel 立体数据集.
`InStereo2k`(root[, split, transforms])	InStereo2k dataset.
`ETH3DStereo`(root[, split, transforms])	ETH3D 低分辨率双视图数据集。
`Middlebury2014Stereo`(root[, split, ...])	Middlebury数据集中公开可用的场景2014 version <https://vision.middlebury.edu/stereo/data/scenes2014/>。

图像对¶

LFWPairs(root[, split, image_set, ...])

LFW Dataset.

PhotoTour(root, name[, train, transform, ...])

多视图立体对应数据集。

图像字幕¶

CocoCaptions(root, annFile[, transform, ...])

MS Coco Captions 数据集。

视频分类¶

`HMDB51`(root, annotation_path, frames_per_clip)	HMDB51 dataset.
`Kinetics`(根目录, 每段帧数[, ...])	通用动力学数据集。
`UCF101`(root, annotation_path, frames_per_clip)	UCF101 dataset.

自定义数据集的基础类¶

`DatasetFolder`(root, loader[, extensions, ...])	一个通用的数据加载器。
`ImageFolder`(root, transform, ...)	一个通用的数据加载器，默认情况下以这种方式排列图像：。
`VisionDataset`(root[, transforms, transform, ...])	用于制作与 torchvision 兼容的数据集的基础类。