目录

运维

torchvision.ops实现特定于计算机视觉的运算符、损失和层。

注意

所有 Operator 都对 TorchScript 提供原生支持。

检测和 Segmentation 运算符

以下运算符执行对象检测和分割模型中所需的预处理和后处理。

(盒子、分数、IDX、iou_threshold)

以批处理方式执行非极大值抑制。

(口罩)

计算提供的蒙版周围的边界框。

(盒子、分数、iou_threshold)

根据框的交集与并集 (IoU) 对框执行非极大值抑制 (NMS)。

(输入、框、output_size[, ...])

使用平均池化执行 Region of Interest (RoI) Align 运算符,如 Mask R-CNN 中所述。

(输入、框、output_size[, ...])

执行快速 R-CNN 中描述的感兴趣区域 (RoI) 池运算符

(输入、框、output_size[, ...])

执行 Light-Head R-CNN 中提到的位置敏感感兴趣区域 (RoI) 对齐运算符。

(输入、框、output_size[, ...])

执行 R-FCN 中描述的位置敏感感兴趣区域 (RoI) 池运算符

(in_channels_list,......

模块,该模块从一组特征图的顶部添加 FPN。

(featmap_names,...[, ...])

多尺度 RoIAlign 池化,对于有或没有 FPN 的检测都很有用。

(output_size、spatial_scale、...[, ...])

请参阅

(output_size、spatial_scale)

请参阅

(output_size、spatial_scale、......

请参阅

(output_size、spatial_scale)

请参阅

Box 运算符

这些实用程序函数对边界框执行各种操作。

(框)

计算一组边界框的面积,这些边界框由其 (x1, y1, x2, y2) 坐标指定。

(框、in_fmt、out_fmt)

框从 given 转换为 .in_fmtout_fmt

(方框 1、方框 2)

返回两组框之间的交集与联合 (Jaccard index)。

(盒子、尺寸)

剪辑框,以便它们位于大小为 .size

(方框 1、方框 2[、EPS])

返回两组框之间的完整交集与联合(Jaccard 索引)。

(方框 1、方框 2[、EPS])

两组框之间的交交并 (Jaccard index) 返回距离。

(方框 1、方框 2)

返回两组框之间的广义交集 (Jaccard index)。

(框,min_size)

删除至少包含一个边长小于 的所有框。boxesmin_size

损失

实现了以下特定于视觉的损失函数:

(方框 1、方框 2[、...])

梯度友好的 IoU 损失,当框不重叠时,额外的惩罚为非零。

(方框 1、方框 2[、...])

梯度友好的 IoU 损失,当框中心之间的距离不为零时,额外的惩罚为非零。

(方框 1、方框 2[、...])

梯度友好的 IoU 损失,当框不重叠时,额外的惩罚为非零,并且随着其最小封闭框的大小而缩放。

(inputs, targets[, alpha, ...])

在 RetinaNet 中用于密集检测的损失:https://arxiv.org/abs/1708.02002

TorchVision 提供常用的构建块作为层:

(in_channels,......

用于 Convolution2d-Normalization-Activation 模块的可配置模块。

(in_channels,......

用于 Convolution3d-Normalization-Activation 模块的可配置模块。

(in_channels、out_channels......

请参阅

(p, block_size[, inplace, eps])

请参阅

(p, block_size[, inplace, eps])

请参阅

(num_features[, 每集])

BatchNorm2d,其中批处理统计信息和仿射参数是固定的

(in_channels、hidden_channels......

此模块实现了多层感知器 (MLP) 模块。

(维度)

此模块返回张量输入的视图,其维度已排列。

(input_channels,......

此模块实现了 https://arxiv.org/abs/1709.01507 中的 Squeeze-and-Excitation 模块(参见图 2)。

(p,模式)

请参阅

(input, offset, weight[, bias, ...])

执行可变形卷积 v2,如 Deformable ConvNets v2:更可变形,结果更好,如果不是,则执行可变形卷积,如 Deformable Convolutional Networks 中所述。maskNonemaskNone

(输入, p, block_size[, ...])

实现 “DropBlock: A regularization method for convolutional networks” <https://arxiv.org/abs/1810.12890>中的 DropBlock2d。

(输入, p, block_size[, ...])

实现 “DropBlock: A regularization method for convolutional networks” <https://arxiv.org/abs/1810.12890>中的 DropBlock3d。

(输入、p、模式[、训练])

实现 “Deep Networks with Stochastic Depth” 中的随机深度,用于随机放置残差架构的残差分支。

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源