目录

数据

Torchvision 在模块中提供了许多内置数据集,以及用于构建自己的数据集的实用程序类。torchvision.datasets

内置数据集

所有数据集都是 i.即,它们具有 和 实现的方法。 因此,它们都可以传递给 a,后者可以使用 worker 并行加载多个样本。 例如:__getitem____len__torch.multiprocessing

imagenet_data = torchvision.datasets.ImageNet('path/to/imagenet_root/')
data_loader = torch.utils.data.DataLoader(imagenet_data,
                                          batch_size=4,
                                          shuffle=True,
                                          num_workers=args.nThreads)

所有数据集都有几乎相似的 API。它们都有两个常见的参数:分别转换 input 和 target。 您还可以使用提供的基类创建自己的数据集。transformtarget_transform

图像分类

(根[, target_type, 转换, ...])

加州理工学院 101数据。

(根[, 转换, ...])

加州理工学院 256数据。

(根[, 分裂, target_type, ...])

大规模 CelebFaces 属性 (CelebA) 数据集数据。

(根[、训练、转换、...])

CIFAR10数据。

(根[、训练、转换、...])

CIFAR100数据。

(根[、拆分、转换、...])

来自 OpenAI 的 Country211 数据集

(根[、拆分、分区、转换、...])

可描述纹理数据集 (DTD)。

(根,拆分,**kwargs)

EMNIST数据。

(根[, 变换, target_transform, ...])

EuroSAT 数据集的 RGB 版本。

([大小、image_size、num_classes、...])

一个虚假数据集,返回随机生成的图像并将其作为 PIL 图像返回

(根[、训练、转换、...])

时尚 MNIST数据。

(根[、拆分、转换、...])

FER2013数据。

(root[, split, ...])

FGVC 飞机数据。

(根, ann_file[, 转换, ...])

Flickr8k 实体数据。

(根, ann_file[, 转换, ...])

Flickr30k 实体数据。

(根[、拆分、转换、...])

牛津 102 花数据。

(根[、拆分、转换、...])

Food-101 数据集

(根[、拆分、转换、...])

德国交通标志识别基准 (GTSRB)数据。

(root[, version, target_type, ...])

iNaturalist 智能博物学家数据。

(root[, split])

ImageNet 2012 分类数据集。

(root[, split, size, download, ...])

Imagenette 图像分类数据集。

(根[、训练、转换、...])

Kuzushiji-MNIST数据。

(root[, split, image_set, ...])

LFW数据。

(根[、类、转换、...])

LSUN 数据集。

(根[、训练、转换、...])

MNIST数据。

(根[, 背景, 转换, ...])

Omniglot (全能)数据。

(root[, split, target_types, ...])

Oxford-IIIT 宠物数据集

(根,~pathlib.Path]、split 等

Places365 分类数据集。

(根[、拆分、转换、...])

PCAM 数据集

(root[, what, compat, train])

QMNIST 公司数据。

(根[、拆分、转换、...])

渲染的 SST2 数据集

(根[, 变换, target_transform, ...])

赛美安数据。

(根[, 变换, target_transform, ...])

SBU 字幕照片数据。

(根[、拆分、转换、...])

Stanford Cars 数据集

(根[、拆分、折叠、转换、...])

STL10 系列数据。

(根[, 变换, target_transform, ...])

SUN397 数据集

(根[、拆分、转换、...])

SVHN 系列数据。

(根[、训练、转换、...])

美国 邮政数据。

图像检测或分割

(根、annFile[、转换、...])

MS Coco 检测数据。

(根[, 分裂, target_type, ...])

大规模 CelebFaces 属性 (CelebA) 数据集数据。

(root[, split, mode, target_type, ...])

城市景观数据。

(根[、训练、转换、...])

KITTI数据。

(root[, split, target_types, ...])

Oxford-IIIT 宠物数据集

(root[, image_set, mode, download, ...])

语义边界数据集

(根[, 年份, image_set, ...])

帕斯卡 VOCSegmentation 数据集。

(根[, 年份, image_set, ...])

帕斯卡 VOC检测数据集。

(根[、拆分、转换、...])

WIDERFace数据。

光流

(根[、拆分、转换])

FlyingChairs 飞椅光流数据集。

(根[, 拆分, pass_name, ...])

FlyingThings3D 数据集。

(根[、拆分、转换])

HD1K 数据集。

(根[、拆分、转换])

光流的 KITTI 数据集 (2015)。

(根[、拆分、pass_name、转换])

辛特光流数据集。

立体声匹配

(根 [, 转换])

CREStereo github 存储库中链接的 Carla 模拟器数据。

(根[、拆分、转换])

来自 2012 年立体评估基准的 KITTI 数据集。

(根[、拆分、转换])

来自 2015 年立体评估基准的 KITTI 数据集。

(根 [, 转换])

用于训练 CREStereo 架构的合成数据集。

(根 [, 变体, 转换])

FallingThings 数据集。

(root[, 变体, pass_name, ...])

Scene Flow 数据集的数据集接口。

(根[, pass_name, 转换])

Sintel 立体数据集

(根[、拆分、转换])

InStereo2k 数据集。

(根[、拆分、转换])

ETH3D Low-Res Two-View 数据集。

(root[, split, ...])

Middlebury 数据集 2014 版 <https://vision.middlebury.edu/stereo/data/scenes2014/> 中公开可用的场景。

图像对

(root[, split, image_set, ...])

LFW数据。

(根、名称[、训练、转换、...])

多视图立体对应数据。

图像字幕

(根、annFile[、转换、...])

MS Coco 字幕数据。

视频分类

(根、annotation_path、frames_per_clip)

HMDB51 数据集。

(根, frames_per_clip[, ...])

Generic Kinetics 数据集。

(根、annotation_path、frames_per_clip)

UCF101 数据集。

视频预测

(root[, split, split_ratio, ...])

移动 MNIST数据。

自定义数据集的基类

(root, loader[, extensions, ...])

通用数据加载器。

(根,~pathlib.Path]、transform 等

默认情况下,图像以这种方式排列的通用数据加载器:.

([根, 变换, 变换, ...])

Base Class 用于制作与 torchvision 兼容的数据集。

转换 v2

(数据集[, ...])

将 a 包装起来,以便与 .torchvision.datasettorchvision.transforms.v2

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源