运维¶
torchvision.ops
实现特定于计算机视觉的运算符、损失和层。
注意
所有 Operator 都对 TorchScript 提供原生支持。
检测和 Segmentation 运算符¶
以下运算符执行对象检测和分割模型中所需的预处理和后处理。
以批处理方式执行非极大值抑制。 |
|
计算提供的蒙版周围的边界框。 |
|
根据框的交集与并集 (IoU) 对框执行非极大值抑制 (NMS)。 |
|
使用平均池化执行 Region of Interest (RoI) Align 运算符,如 Mask R-CNN 中所述。 |
|
执行快速 R-CNN 中描述的感兴趣区域 (RoI) 池运算符 |
|
执行 Light-Head R-CNN 中提到的位置敏感感兴趣区域 (RoI) 对齐运算符。 |
|
执行 R-FCN 中描述的位置敏感感兴趣区域 (RoI) 池运算符 |
模块,该模块从一组特征图的顶部添加 FPN。 |
|
多尺度 RoIAlign 池化,对于有或没有 FPN 的检测都很有用。 |
|
Box 运算符¶
这些实用程序函数对边界框执行各种操作。
计算一组边界框的面积,这些边界框由其 (x1, y1, x2, y2) 坐标指定。 |
|
将框从给定in_fmt转换为out_fmt。 |
|
返回两组框之间的交集与联合 (Jaccard index)。 |
|
剪辑框,以便它们位于 size 大小的图像内。 |
|
返回两组框之间的完整交集与联合(Jaccard 索引)。 |
|
两组框之间的交交并 (Jaccard index) 返回距离。 |
|
返回两组框之间的广义交集 (Jaccard index)。 |
|
移除至少包含一侧小于min_size的箱子。 |
损失¶
实现了以下特定于视觉的损失函数:
梯度友好的 IoU 损失,当框不重叠时,额外的惩罚为非零。 |
|
梯度友好的 IoU 损失,当框中心之间的距离不为零时,额外的惩罚为非零。 |
|
梯度友好的 IoU 损失,当框不重叠时,额外的惩罚为非零,并且随着其最小封闭框的大小而缩放。 |
|
在 RetinaNet 中用于密集检测的损失:https://arxiv.org/abs/1708.02002。 |
层¶
TorchVision 提供常用的构建块作为层:
用于 Convolution2d-Normalization-Activation 模块的可配置模块。 |
|
用于 Convolution3d-Normalization-Activation 模块的可配置模块。 |
|
BatchNorm2d,其中批处理统计信息和仿射参数是固定的 |
|
此模块实现了多层感知器 (MLP) 模块。 |
|
此模块返回张量输入的视图,其维度已排列。 |
|
此模块实现了 https://arxiv.org/abs/1709.01507 中的 Squeeze-and-Excitation 模块(参见图 2)。 |
|
执行可变形卷积 v2,如 Deformable ConvNets v2:更可变形,结果更好,如果不是,则执行可变形卷积,如 Deformable Convolutional Networks 中所述。 |
|
实现 “DropBlock: A regularization method for convolutional networks” <https://arxiv.org/abs/1810.12890>中的 DropBlock2d。 |
|
实现 “DropBlock: A regularization method for convolutional networks” <https://arxiv.org/abs/1810.12890>中的 DropBlock3d。 |
|
实现 “Deep Networks with Stochastic Depth” 中的随机深度,用于随机放置残差架构的残差分支。 |