操作符¶
torchvision.ops 实现了特定于计算机视觉的操作符、损失函数和层。
注意
所有运算符都原生支持TorchScript。
检测与分割运算符¶
以下操作符执行对象检测和分割模型所需的数据预处理和后处理。
|
以批量方式执行非最大抑制。 |
|
计算所提供掩码周围的边界框。 |
|
根据交并比(IoU)对框执行非最大值抑制(NMS)。 |
|
执行Mask R-CNN中描述的带平均池化的感兴趣区域(RoI)对齐操作。 |
|
执行Fast R-CNN中描述的兴趣区域(RoI)池化操作 |
|
执行轻量级头部R-CNN中提到的位置敏感感兴趣区域(RoI)对齐操作。 |
|
执行R-FCN中描述的位置敏感感兴趣区域(RoI)池化操作 |
|
在一组特征图之上添加FPN模块。 |
|
多尺度RoIAlign池化,这对于使用或不使用FPN的检测都非常有用。 |
|
查看 |
|
查看 |
|
查看 |
|
查看 |
算子小部件¶
这些实用函数对边界框执行各种操作。
|
计算一组边界框的面积,这些边界框通过其 (x1, y1, x2, y2) 坐标指定。 |
|
将 |
|
返回两组框之间的交并比(雅卡尔指数)。 |
|
将框裁剪到大小为 |
|
返回两组框之间的完整交并比(雅卡尔指数)。 |
|
返回两组框之间的交并比(雅卡尔指数)。 |
|
返回两组框之间的广义交并比(雅卡尔指数)。 |
|
移除 |
损失函数¶
以下实现了特定于视觉的任务损失函数:
|
带有额外惩罚项的梯度友好型IoU损失,在框不重叠时该惩罚项非零。 |
|
带有额外惩罚项的梯度友好型IoU损失,当框中心之间的距离不为零时,该惩罚项也不为零。 |
|
带有额外惩罚项的梯度友好型IoU损失,在框不重叠时惩罚项非零,并且与它们最小外接框的大小成比例。 |
|
RetinaNet密集检测中使用的损失函数:https://arxiv.org/abs/1708.02002。 |
层¶
TorchVision 提供了常用的构建模块作为层:
|
可配置块,用于卷积二维-归一化-激活块。 |
|
可配置块,用于卷积3D-归一化-激活块。 |
|
查看 |
|
查看 |
|
查看 |
|
BatchNorm2d,其中批量统计信息和仿射参数是固定的 |
|
此块实现了多层感知器(MLP)模块。 |
|
此模块返回一个张量输入的视图,并对其维度进行置换。 |
|
此块实现了来自https://arxiv.org/abs/1709.01507 的Squeeze-and-Excitation块(见图。 |
|
|
执行可变形卷积v2,如可变形卷积网络v2:更可变形,更好结果中所述,如果 |
|
实现来自"DropBlock: A regularization method for convolutional networks" <https://arxiv.org/abs/1810.12890>的DropBlock2d。 |
|
实现来自"DropBlock: A regularization method for convolutional networks" <https://arxiv.org/abs/1810.12890>的DropBlock3d。 |
|
实现了 "深度网络中的随机深度" 中的随机深度,用于随机丢弃残差架构中的残差分支。 |