目录

数据集

Torchvision 提供了许多内置数据集在 torchvision.datasets 模块中,以及用于构建您自己的数据集的实用程序类。

内置数据集

所有数据集都是 torch.utils.data.Dataset 的子类, 即,它们实现了 __getitem____len__ 方法。 因此,它们都可以传递给一个 torch.utils.data.DataLoader, 该对象可以使用 torch.multiprocessing 个工作者并行加载多个样本。 例如:

imagenet_data = torchvision.datasets.ImageNet('path/to/imagenet_root/')
data_loader = torch.utils.data.DataLoader(imagenet_data,
                                          batch_size=4,
                                          shuffle=True,
                                          num_workers=args.nThreads)

所有数据集的API几乎相同。它们都有两个通用参数: transformtarget_transform 分别用于转换输入和目标。 您还可以使用提供的基类创建自己的数据集。

图像分类

Caltech101(根目录[, 目标类型, 变换, ...])

Caltech 101 数据集。

Caltech256(根目录[, 变换, ...])

Caltech 256 数据集。

CelebA(root[, split, target_type, ...])

大规模名人面部属性(CelebA)数据集 数据集。

CIFAR10(root[, train, transform, ...])

CIFAR10 Dataset.

CIFAR100(root[, train, transform, ...])

CIFAR100 Dataset.

Country211(根目录[,拆分,转换,...])

Country211数据集 来自OpenAI。

DTD(root[, split, partition, transform, ...])

可描述纹理数据集 (DTD).

EMNIST(root, split, **kwargs)

EMNIST Dataset.

EuroSAT(root[, transform, target_transform, ...])

RGB版本的EuroSAT数据集。

FakeData([size, image_size, num_classes, ...])

一个返回随机生成图像的假数据集,并将其作为PIL图像返回。

FashionMNIST(root[, train, transform, ...])

Fashion-MNIST Dataset.

FER2013(root[, split, transform, ...])

FER2013 Dataset.

FGVCAircraft(root[, split, ...])

FGVC Aircraft 数据集。

Flickr8k(根目录, ann_file[, transform, ...])

Flickr8k 实体 数据集。

Flickr30k(根目录, ann_file[, transform, ...])

Flickr30k 实体 数据集。

Flowers102(根目录[,拆分,转换,...])

牛津102花卉 数据集。

Food101(根目录[,拆分,转换,...])

Food-101数据集.

GTSRB(root[, split, transform, ...])

德国交通标志识别基准 (GTSRB) 数据集。

INaturalist(root[, version, target_type, ...])

iNaturalist Dataset.

ImageNet(root[, split])

ImageNet 2012 分类数据集。

Imagenette(根目录[,拆分,大小,下载,…])

Imagenette 图像分类数据集。

KMNIST(root[, train, transform, ...])

Kuzushiji-MNIST Dataset.

LFWPeople(root[, split, image_set, ...])

LFW Dataset.

LSUN(root[, classes, transform, ...])

LSUN dataset.

MNIST(root[, train, transform, ...])

MNIST Dataset.

Omniglot(根目录[,背景,变换,...])

Omniglot 数据集。

OxfordIIITPet(root[, split, target_types, ...])

牛津-印度理工学院宠物数据集.

Places365(根目录, ~pathlib.Path], 拆分, ...)

Places365 分类数据集。

PCAM(root[, split, transform, ...])

PCAM数据集.

QMNIST(root[, what, compat, train])

QMNIST Dataset.

RenderedSST2(root[, split, transform, ...])

渲染后的SST2数据集.

SEMEION(root[, transform, target_transform, ...])

SEMEION Dataset.

SBU(root[, transform, target_transform, ...])

SBU 标注照片 数据集。

StanfordCars(root[, split, transform, ...])

斯坦福汽车数据集

STL10(root[, split, folds, transform, ...])

STL10 Dataset.

SUN397(root[, transform, target_transform, ...])

SUN397数据集.

SVHN(root[, split, transform, ...])

SVHN Dataset.

USPS(root[, train, transform, ...])

USPS Dataset.

图像检测或分割

CocoDetection(root, annFile[, transform, ...])

MS Coco Detection 数据集。

CelebA(root[, split, target_type, ...])

大规模名人面部属性(CelebA)数据集 数据集。

Cityscapes(根目录[, 拆分, 模式, 目标类型, ...])

城市景观 数据集。

Kitti(根目录[,训练,变换,...])

KITTI Dataset.

OxfordIIITPet(root[, split, target_types, ...])

牛津-印度理工学院宠物数据集.

SBDataset(root[, image_set, mode, download, ...])

语义边界数据集

VOCSegmentation(root[, year, image_set, ...])

Pascal VOC 分割数据集。

VOCDetection(root[, year, image_set, ...])

Pascal VOC 目标检测数据集。

WIDERFace(root[, split, transform, ...])

WIDERFace Dataset.

光流

FlyingChairs(root[, split, transforms])

FlyingChairs 数据集用于光流。

FlyingThings3D(root[, split, pass_name, ...])

FlyingThings3D 数据集用于光流。

HD1K(root[, split, transforms])

HD1K 数据集用于光流。

KittiFlow(root[, split, transforms])

KITTI 数据集用于光流(2015)。

Sintel(根目录[,拆分,传递名称,变换])

Sintel 数据集用于光流。

立体匹配

CarlaStereo(root[, transforms])

Carla模拟器数据链接在CREStereo github仓库中。

Kitti2012Stereo(root[, split, transforms])

KITTI数据集来自2012年立体评估基准

Kitti2015Stereo(root[, split, transforms])

KITTI数据集来自2015年立体评估基准

CREStereo(root[, transforms])

用于训练CREStereo架构的合成数据集。

FallingThingsStereo(root[, variant, transforms])

FallingThings dataset.

SceneFlowStereo(root[, variant, pass_name, ...])

数据集接口用于Scene Flow数据集。

SintelStereo(root[, pass_name, transforms])

Sintel 立体数据集.

InStereo2k(root[, split, transforms])

InStereo2k dataset.

ETH3DStereo(root[, split, transforms])

ETH3D 低分辨率双视图 数据集。

Middlebury2014Stereo(root[, split, ...])

Middlebury数据集中公开可用的场景2014 version <https://vision.middlebury.edu/stereo/data/scenes2014/>

图像对

LFWPairs(root[, split, image_set, ...])

LFW Dataset.

PhotoTour(root, name[, train, transform, ...])

多视图立体对应 数据集。

图像字幕

CocoCaptions(root, annFile[, transform, ...])

MS Coco Captions 数据集。

视频分类

HMDB51(root, annotation_path, frames_per_clip)

HMDB51 dataset.

Kinetics(根目录, 每段帧数[, ...])

通用动力学 数据集。

UCF101(root, annotation_path, frames_per_clip)

UCF101 dataset.

视频预测

MovingMNIST(root[, split, split_ratio, ...])

MovingMNIST Dataset.

自定义数据集的基础类

DatasetFolder(root, loader[, extensions, ...])

一个通用的数据加载器。

ImageFolder(root, transform, ...)

一个通用的数据加载器,默认情况下以这种方式排列图像:。

VisionDataset([root, transforms, transform, ...])

用于制作与 torchvision 兼容的数据集的基础类。

变换 v2

wrap_dataset_for_transforms_v2(dataset[, ...])

torchvision.dataset 包装以与 torchvision.transforms.v2 一起使用。

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源