运维¶

torchvision.ops实现特定于计算机视觉的运算符、损失和层。

注意

所有 Operator 都对 TorchScript 提供原生支持。

检测和 Segmentation 运算符¶

以下运算符执行对象检测和分割模型中所需的预处理和后处理。

`batched_nms`（盒子、分数、IDX、iou_threshold）	以批处理方式执行非极大值抑制。
`masks_to_boxes`（口罩）	计算提供的蒙版周围的边界框。
`nms`（方框、分数、iou_threshold）	根据框的交集与并集（IoU）对框执行非极大值抑制（NMS）。
`roi_align`（输入、框、output_size[， ...]）	使用平均池化执行 Region of Interest （RoI） Align 运算符，如 Mask R-CNN 中所述。
`roi_pool`（输入、框、output_size[， ...]）	执行快速 R-CNN 中描述的感兴趣区域（RoI）池运算符
`ps_roi_align`（输入、框、output_size[， ...]）	执行 Light-Head R-CNN 中提到的位置敏感感兴趣区域（RoI）对齐运算符。
`ps_roi_pool`（输入、框、output_size[， ...]）	执行 R-FCN 中描述的位置敏感感兴趣区域（RoI）池运算符

`FeaturePyramidNetwork`（in_channels_list，......	模块，该模块从一组特征图的顶部添加 FPN。
`MultiScaleRoIAlign`（featmap_names，...[, ...])	多尺度 RoIAlign 池化，对于有或没有 FPN 的检测都很有用。
`RoIAlign`（output_size、spatial_scale、...[, ...])	看`roi_align()`.
`RoIPool`（output_size、spatial_scale）	看`roi_pool()`.
`PSRoIAlign`（output_size、spatial_scale......	看`ps_roi_align()`.
`PSRoIPool`（output_size、spatial_scale）	看`ps_roi_pool()`.

这些实用程序函数对边界框执行各种作。

`box_area`（框）	计算一组边界框的面积，这些边界框由其（x1， y1， x2， y2）坐标指定。
`box_convert`（框、in_fmt、out_fmt）	将框从给定in_fmt转换为out_fmt。
`box_iou`（方框 1、方框 2）	返回两组框之间的交集与联合（Jaccard index）。
`clip_boxes_to_image`（盒子、尺寸）	剪辑框，以便它们位于 size 大小的图像内。
`complete_box_iou`（方框 1、方框 2[、EPS]）	返回两组框之间的完整交集与联合（Jaccard 索引）。
`distance_box_iou`（方框 1、方框 2[、EPS]）	两组框之间的交交并（Jaccard index）返回距离。
`generalized_box_iou`（方框 1、方框 2）	返回两组框之间的广义交集（Jaccard index）。
`remove_small_boxes`（框，min_size）	移除至少包含一侧小于min_size的箱子。

实现了以下特定于视觉的损失函数：

`complete_box_iou_loss`（方框 1、方框 2[、...]）	梯度友好的 IoU 损失，当框不重叠时，额外的惩罚为非零。
`distance_box_iou_loss`（方框 1、方框 2[、...]）	梯度友好的 IoU 损失，当框中心之间的距离不为零时，额外的惩罚为非零。
`generalized_box_iou_loss`（方框 1、方框 2[、...]）	梯度友好的 IoU 损失，当框不重叠时，额外的惩罚为非零，并且随着其最小封闭框的大小而缩放。
`sigmoid_focal_loss`（inputs， targets[， alpha， ...]）	在 RetinaNet 中用于密集检测的损失：https://arxiv.org/abs/1708.02002。

TorchVision 提供常用的构建块作为层：

`Conv2dNormActivation`（in_channels，......	用于 Convolution2d-Normalization-Activation 模块的可配置模块。
`Conv3dNormActivation`（in_channels，......	用于 Convolution3d-Normalization-Activation 模块的可配置模块。
`DeformConv2d`（in_channels、out_channels......	看`deform_conv2d()`.
`DropBlock2d`（p， block_size[，原地， EPS]）	看`drop_block2d()`.
`DropBlock3d`（p， block_size[，原地， EPS]）	看`drop_block3d()`.
`FrozenBatchNorm2d`（num_features[，每集]）	BatchNorm2d，其中批处理统计信息和仿射参数是固定的
`MLP`（in_channels、hidden_channels、......	此模块实现了多层感知器（MLP）模块。
`Permute`（维度）	此模块返回张量输入的视图，其维度已排列。
`SqueezeExcitation`（input_channels，......	此模块实现了 https://arxiv.org/abs/1709.01507 中的 Squeeze-and-Excitation 模块（参见图 2）。
`StochasticDepth`（p，模式）	看`stochastic_depth()`.

`deform_conv2d`（input， offset， weight[， bias， ...]）	执行可变形卷积 v2，如 Deformable ConvNets v2：更可变形，结果更好，如果不是，则执行可变形卷积，如 Deformable Convolutional Networks 中所述。`maskNonemaskNone`
`drop_block2d`（输入， p， block_size[， ...]）	实现 “DropBlock： A regularization method for convolutional networks” <https://arxiv.org/abs/1810.12890>中的 DropBlock2d。
`drop_block3d`（输入， p， block_size[， ...]）	实现 “DropBlock： A regularization method for convolutional networks” <https://arxiv.org/abs/1810.12890>中的 DropBlock3d。
`stochastic_depth`（输入、p、模式[、训练]）	实现 “Deep Networks with Stochastic Depth” 中的随机深度，用于随机放置残差架构的残差分支。