目录

运维

torchvision.ops实现特定于计算机视觉的运算符。

注意

所有 Operator 都对 TorchScript 提供原生支持。

(盒子、分数、IDX、iou_threshold)

以批处理方式执行非极大值抑制。

(框)

计算一组边界框的面积,这些边界框由其 (x1, y1, x2, y2) 坐标指定。

(框、in_fmt、out_fmt)

将框从给定in_fmt转换为out_fmt。

(方框 1、方框 2)

返回两组框之间的交集与联合 (Jaccard index)。

(盒子、尺寸)

剪辑框,以便它们位于 size 大小的图像内。

(input, offset, weight[, bias, ...])

执行可变形卷积 v2,如 Deformable ConvNets v2:更可变形,结果更好,如果不是,则执行可变形卷积,如 Deformable Convolutional Networks 中所述。maskNonemaskNone

(方框 1、方框 2)

返回两组框之间的广义交集 (Jaccard index)。

(方框 1、方框 2[、...])

https://github.com/facebookresearch/fvcore/blob/bfff2ef/fvcore/nn/giou_loss.py 的原始实现

(口罩)

计算提供的蒙版周围的边界框。

(盒子、分数、iou_threshold)

根据框的交集与并集 (IoU) 对框执行非极大值抑制 (NMS)。

(输入、框、output_size[, ...])

执行 Light-Head R-CNN 中提到的位置敏感感兴趣区域 (RoI) 对齐运算符。

(输入、框、output_size[, ...])

执行 R-FCN 中描述的位置敏感感兴趣区域 (RoI) 池运算符

(框,min_size)

移除至少包含一侧小于min_size的箱子。

(输入、框、output_size[, ...])

使用平均池化执行 Region of Interest (RoI) Align 运算符,如 Mask R-CNN 中所述。

(输入、框、output_size[, ...])

执行快速 R-CNN 中描述的感兴趣区域 (RoI) 池运算符

(inputs, targets[, alpha, ...])

https://github.com/facebookresearch/fvcore/blob/master/fvcore/nn/focal_loss.py 的原始实现。

(输入、p、模式[、训练])

实现 “Deep Networks with Stochastic Depth” 中的随机深度,用于随机放置残差架构的残差分支。

(output_size、spatial_scale、......

请参阅

(output_size、spatial_scale、......

请参阅

(output_size、spatial_scale)

请参阅

(output_size、spatial_scale)

请参阅

(in_channels、out_channels......

请参阅

(featmap_names,......

多尺度 RoIAlign 池化,对于有或没有 FPN 的检测都很有用。

(in_channels_list,......

模块,该模块从一组特征图的顶部添加 FPN。

(p,模式)

请参阅

(num_features 年,每集)

BatchNorm2d,其中批处理统计信息和仿射参数是固定的

(input_channels,......

此模块实现了 https://arxiv.org/abs/1709.01507 中的 Squeeze-and-Excitation 模块(参见图 2)。

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源