数据¶
Torchvision 在模块中提供了许多内置数据集,以及用于构建自己的数据集的实用程序类。torchvision.datasets
内置数据集¶
所有数据集都是 i.即,它们具有 和 实现的方法。
因此,它们都可以传递给 a
,后者可以使用 worker 并行加载多个样本。
例如:
__getitem__
__len__
torch.multiprocessing
imagenet_data = torchvision.datasets.ImageNet('path/to/imagenet_root/')
data_loader = torch.utils.data.DataLoader(imagenet_data,
batch_size=4,
shuffle=True,
num_workers=args.nThreads)
所有数据集都有几乎相似的 API。它们都有两个常见的参数:分别转换 input 和 target。
您还可以使用提供的基类创建自己的数据集。transform
target_transform
图像分类¶
加州理工学院 101数据。 |
|
加州理工学院 256数据。 |
|
CIFAR10数据。 |
|
CIFAR100数据。 |
|
来自 OpenAI 的 Country211 数据集。 |
|
EMNIST数据。 |
|
EuroSAT 数据集的 RGB 版本。 |
|
一个虚假数据集,返回随机生成的图像并将其作为 PIL 图像返回 |
|
时尚 MNIST数据。 |
|
FER2013数据。 |
|
FGVC 飞机数据。 |
|
Flickr8k 实体数据。 |
|
Flickr30k 实体数据。 |
|
牛津 102 花数据。 |
|
ImageNet 2012 分类数据集。 |
|
Imagenette 图像分类数据集。 |
|
LFW数据。 |
|
LSUN 数据集。 |
|
MNIST数据。 |
|
Places365 分类数据集。 |
|
QMNIST 公司数据。 |
|
赛美安数据。 |
|
SBU 字幕照片数据。 |
|
Stanford Cars 数据集 |
|
STL10 系列数据。 |
|
SVHN 系列数据。 |
|
美国 邮政数据。 |
图像检测或分割¶
MS Coco 检测数据。 |
|
城市景观数据。 |
|
KITTI数据。 |
|
帕斯卡 VOCSegmentation 数据集。 |
|
帕斯卡 VOC检测数据集。 |
|
WIDERFace数据。 |
光流¶
FlyingChairs 飞椅光流数据集。 |
|
FlyingThings3D 数据集。 |
|
HD1K 数据集。 |
|
光流的 KITTI 数据集 (2015)。 |
|
辛特光流数据集。 |
立体声匹配¶
CREStereo github 存储库中链接的 Carla 模拟器数据。 |
|
来自 2012 年立体评估基准的 KITTI 数据集。 |
|
来自 2015 年立体评估基准的 KITTI 数据集。 |
|
用于训练 CREStereo 架构的合成数据集。 |
|
FallingThings 数据集。 |
|
Scene Flow 数据集的数据集接口。 |
|
Sintel 立体数据集。 |
|
InStereo2k 数据集。 |
|
ETH3D Low-Res Two-View 数据集。 |
|
Middlebury 数据集 2014 版 <https://vision.middlebury.edu/stereo/data/scenes2014/> 中公开可用的场景。 |
图像对¶
LFW数据。 |
|
多视图立体对应数据。 |
视频分类¶
HMDB51 数据集。 |
|
Generic Kinetics 数据集。 |
|
UCF101 数据集。 |
视频预测¶
移动 MNIST数据。 |
自定义数据集的基类¶
通用数据加载器。 |
|
默认情况下,图像以这种方式排列的通用数据加载器:. |
|
Base Class 用于制作与 torchvision 兼容的数据集。 |
转换 v2¶
将 a 包装起来,以便与 . |