数据集¶
Torchvision 提供了许多内置数据集在 torchvision.datasets 模块中,以及用于构建您自己的数据集的实用程序类。
内置数据集¶
所有数据集都是 torch.utils.data.Dataset 的子类,
即,它们实现了 __getitem__ 和 __len__ 方法。
因此,它们都可以传递给一个 torch.utils.data.DataLoader,
该对象可以使用 torch.multiprocessing 个工作者并行加载多个样本。
例如:
imagenet_data = torchvision.datasets.ImageNet('path/to/imagenet_root/')
data_loader = torch.utils.data.DataLoader(imagenet_data,
batch_size=4,
shuffle=True,
num_workers=args.nThreads)
所有数据集的API几乎相同。它们都有两个通用参数:
transform 和 target_transform 分别用于转换输入和目标。
您还可以使用提供的基类创建自己的数据集。
图像分类¶
|
Caltech 101 数据集。 |
|
Caltech 256 数据集。 |
|
大规模名人面部属性(CelebA)数据集 数据集。 |
|
CIFAR10 Dataset. |
|
CIFAR100 Dataset. |
|
Country211数据集 来自OpenAI。 |
|
|
|
EMNIST Dataset. |
|
RGB版本的EuroSAT数据集。 |
|
一个返回随机生成图像的假数据集,并将其作为PIL图像返回。 |
|
Fashion-MNIST Dataset. |
|
FER2013 Dataset. |
|
FGVC Aircraft 数据集。 |
|
Flickr8k 实体 数据集。 |
|
Flickr30k 实体 数据集。 |
|
牛津102花卉 数据集。 |
|
|
|
德国交通标志识别基准 (GTSRB) 数据集。 |
|
iNaturalist Dataset. |
|
ImageNet 2012 分类数据集。 |
|
Kuzushiji-MNIST Dataset. |
|
LFW Dataset. |
|
LSUN dataset. |
|
MNIST Dataset. |
|
Omniglot 数据集。 |
|
|
|
Places365 分类数据集。 |
|
|
|
QMNIST Dataset. |
|
|
|
SEMEION Dataset. |
|
SBU 标注照片 数据集。 |
|
斯坦福汽车 数据集 |
|
STL10 Dataset. |
|
|
|
SVHN Dataset. |
|
USPS Dataset. |
图像检测或分割¶
|
MS Coco Detection 数据集。 |
|
大规模名人面部属性(CelebA)数据集 数据集。 |
|
城市景观 数据集。 |
|
德国交通标志识别基准 (GTSRB) 数据集。 |
|
KITTI Dataset. |
|
|
|
|
|
Pascal VOC 分割数据集。 |
|
Pascal VOC 目标检测数据集。 |
|
WIDERFace Dataset. |
光流¶
|
FlyingChairs 数据集用于光流。 |
|
FlyingThings3D 数据集用于光流。 |
|
HD1K 数据集用于光流。 |
|
KITTI 数据集用于光流(2015)。 |
|
Sintel 数据集用于光流。 |
立体匹配¶
|
Carla模拟器数据链接在CREStereo github仓库中。 |
|
KITTI数据集来自2012年立体评估基准。 |
|
KITTI数据集来自2015年立体评估基准。 |
|
用于训练CREStereo架构的合成数据集。 |
|
FallingThings dataset. |
|
数据集接口用于Scene Flow数据集。 |
|
Sintel 立体数据集. |
|
InStereo2k dataset. |
|
ETH3D 低分辨率双视图 数据集。 |
|
Middlebury数据集中公开可用的场景2014 version <https://vision.middlebury.edu/stereo/data/scenes2014/>。 |
图像对¶
|
LFW Dataset. |
|
多视图立体对应 数据集。 |
图像字幕¶
|
MS Coco Captions 数据集。 |
视频分类¶
|
HMDB51 dataset. |
|
通用动力学 数据集。 |
|
UCF101 dataset. |
自定义数据集的基础类¶
|
一个通用的数据加载器。 |
|
一个通用的数据加载器,默认情况下以这种方式排列图像:。 |
|
用于制作与 torchvision 兼容的数据集的基础类。 |