TorchVision¶
此库是 PyTorch 项目的一部分。PyTorch 是一个开源 机器学习框架。
本文档中描述的功能按版本状态分类:
稳定:这些功能将长期维护,通常应该有 在文档中没有重大的性能限制或差距。 我们还希望保持向后兼容性(尽管 可能会发生重大更改,并且将提前一个版本发出通知 的时间)。
试用版:功能被标记为 Beta 版,因为 API 可能会根据 用户反馈,因为性能需要改进,或者因为 跨 Operators 的覆盖范围尚未完成。对于 Beta 版功能,我们是 致力于将该功能一直持续到 Stable 分类。 但是,我们并不承诺向后兼容。
原型:这些功能通常不作为 PyPI 或 Conda 等二进制发行版,但有时落后于运行时 标志,并且处于反馈和测试的早期阶段。
该包由流行的数据集、模型
体系结构,以及计算机视觉的常见图像转换。
- 变换和增强图像
- 模型和预训练权重
- 数据
- 实用程序
- 运维
- batched_nms
- box_area
- box_convert
- box_iou
- clip_boxes_to_image
- deform_conv2d
- generalized_box_iou
- generalized_box_iou_loss
- masks_to_boxes
- 网管
- ps_roi_align
- ps_roi_pool
- remove_small_boxes
- roi_align
- roi_pool
- sigmoid_focal_loss
- stochastic_depth
- RoIAlign
- PSRoIAlign
- RoIPool 公司
- PSRoIPool 公司
- 变形卷积 2d
- MultiScaleRoIAlign
- 特征金字塔网络
- StochasticDepth
- FrozenBatchNorm2d
- SqueezeExcitation (挤压激励)
- 读取/写入图像和视频
- 用于模型检查的特征提取
-
torchvision.
get_video_backend
()[来源]¶ 返回当前用于解码视频的活动视频后端。
- 返回
视频后端的名称。{'pyav', 'video_reader'} 之一。
- 返回类型
-
torchvision.
set_image_backend
(backend)[来源]¶ 指定用于加载图像的包。
- 参数
backend (string) – 图像后端的名称。{'PIL', 'accimage'} 之一。 该软件包使用“英特尔 IPP”库。是的 通常比 PIL 快,但不支持那么多操作。
accimage
-
torchvision.
set_video_backend
(backend)[来源]¶ 指定用于解码视频的包。
- 参数
backend (string) (后端 (字符串)) – 视频后端的名称。{'pyav', 'video_reader'} 之一。 该软件包使用第三方 PyAv 库。它是一个 Pythonic FFmpeg 库的绑定。 该软件包C++包括 top 的 ffmpeg 库,以及 TorchScript 自定义运算符的 python API。 它的解码速度通常比 快,但可能不太健壮。
pyav
video_reader
pyav
注意
默认情况下,在最新的 main 中禁用使用 FFMPEG 进行构建。如果您想使用 'video_reader' backend 中,请从源码编译 torchvision。