操作符
torchvision.ops 实现了特定于计算机视觉的操作。
注意
所有运算符都原生支持TorchScript。
batched_nms(boxes, scores, idxs, iou_threshold)
|
以批量方式执行非最大抑制。 |
box_area(框)
|
计算一组边界框的面积,这些边界框通过其 (x1, y1, x2, y2) 坐标指定。 |
box_convert(boxes, in_fmt, out_fmt)
|
将框从给定的 in_fmt 转换为 out_fmt。 |
box_iou(边界框1, 边界框2)
|
返回两组框之间的交并比(雅卡尔指数)。 |
clip_boxes_to_image(框,大小)
|
将框裁剪到大小为size的图像内。 |
deform_conv2d(input, offset, weight[, bias, …])
|
执行可变形卷积v2,如可变形卷积网络v2:更可变形,更好结果中所述,如果mask不等于None;执行可变形卷积,如可变形卷积网络中所述,如果mask等于None。 |
generalized_box_iou(边界框1, 边界框2)
|
返回两组框之间的广义交并比(雅卡尔指数)。 |
generalized_box_iou_loss(boxes1, boxes2[, …])
|
原始实现来自 https://github.com/facebookresearch/fvcore/blob/bfff2ef/fvcore/nn/giou_loss.py |
masks_to_boxes(掩码)
|
计算所提供掩码周围的边界框。 |
nms(边界框,分数,iou_threshold)
|
根据交并比(IoU)对框执行非最大值抑制(NMS)。 |
ps_roi_align(input, boxes, output_size[, …])
|
执行轻量级头部R-CNN中提到的位置敏感感兴趣区域(RoI)对齐操作。 |
ps_roi_pool(input, boxes, output_size[, …])
|
执行R-FCN中描述的位置敏感感兴趣区域(RoI)池化操作 |
remove_small_boxes(boxes, min_size)
|
移除至少有一边小于 min_size 的框。 |
roi_align(input, boxes, output_size[, …])
|
执行Mask R-CNN中描述的带平均池化的感兴趣区域(RoI)对齐操作。 |
roi_pool(input, boxes, output_size[, …])
|
执行Fast R-CNN中描述的兴趣区域(RoI)池化操作 |
sigmoid_focal_loss(inputs, targets[, alpha, …])
|
原始实现来自 https://github.com/facebookresearch/fvcore/blob/master/fvcore/nn/focal_loss.py . |
stochastic_depth(input, p, mode[, training])
|
实现了来自“深度网络中的随机深度”用于随机丢弃残差架构的残差分支的随机深度。 |
RoIAlign(output_size, spatial_scale, …)
|
查看 roi_align()。 |
PSRoIAlign(output_size, spatial_scale, …)
|
查看 ps_roi_align()。 |
RoIPool(output_size, spatial_scale)
|
查看 roi_pool()。 |
PSRoIPool(output_size, spatial_scale)
|
查看 ps_roi_pool()。 |
DeformConv2d(in_channels, out_channels, …)
|
查看 deform_conv2d()。 |
MultiScaleRoIAlign(featmap_names, …)
|
多尺度RoIAlign池化,这对于使用或不使用FPN的检测都非常有用。 |
FeaturePyramidNetwork(in_channels_list, …)
|
在一组特征图之上添加FPN模块。 |
StochasticDepth(张量, 模式)
|
查看 stochastic_depth()。 |
FrozenBatchNorm2d(num_features, eps)
|
BatchNorm2d,其中批量统计信息和仿射参数是固定的 |
SqueezeExcitation(input_channels, …)
|
此块实现了来自https://arxiv.org/abs/1709.01507 的Squeeze-and-Excitation块(见图。 |