目录

torchvision.utils 文件

torchvision.utils.make_grid(张量Union[torch.张量List[torch.Tensor]]nrow int = 8padding int = 2normalize bool = falsevalue_range: 可选[Tuple[int int]] = Nonescale_each: bool = Falsepad_value: int = 0**kwargstorch。张量[来源]

制作图像网格。

参数
  • tensorTensor or list) – 形状为 (B x C x H x W) 的 4D 小批量张量 或大小相同的图像列表。

  • nrowintoptional) – 网格每行中显示的图像数。 最终网格大小为 。违约:。(B / nrow, nrow)8

  • paddingintoptional) - 填充量。违约:。2

  • normalizebool可选) – 如果为 True,则将图像移动到 (0, 1) 范围内, 按 指定的最小值和最大值。违约:。value_rangeFalse

  • value_rangetupleoptional) – 元组 (min, max),其中 min 和 max 是数字, 然后,这些数字用于标准化图像。默认情况下,min 和 max 是从张量计算得出的。

  • scale_eachbooloptional) – 如果 ,则缩放批次 images 而不是 (min, max) 覆盖所有图像。违约:。TrueFalse

  • pad_value (float, optional) ( (float, optional) (浮点数,可选) – 填充像素的值。违约:。0

返回

包含图像网格的张量。

返回类型

grid (张量)

使用 的示例 :make_grid

torchvision.utils.save_image(张量Union[torch.张量List[torch.张量]]fpUnion[str pathlib.路径BinaryIO]格式可选[str] = None**kwargsNone[来源]

将给定的 Tensor 保存到图像文件中。

参数
  • tensorTensor or list) - 要保存的图像。如果给定一个 mini-batch 张量, 通过调用 将张量保存为图像网格。make_grid

  • fpstring or file object) – 文件名或文件对象

  • format可选) – 如果省略,则要使用的格式由文件扩展名确定。 如果使用 file 对象而不是 filename,则应始终使用此参数。

  • **kwargs – 其他参数记录在 中。make_grid

torchvision.utils.draw_bounding_boxes(图片Torch。张量torch。张量标签可选[List[str]] = 颜色可选[Union[列表[Union[str Tuple[int int int]]], str Tuple[int int int]]] = Nonefill 可选[bool] = Falsewidth int = 1font 可选[str] = font_size int = 10) → torch。张量[来源]

在给定图像上绘制边界框。 输入图像的值应为 uint8,介于 0 和 255 之间。 如果 fill 为 True,则 Resulting Tensor 应保存为 PNG 图像。

参数
  • imageTensor) - 形状为 (C x H x W) 且数据类型为 uint8 的张量。

  • boxesTensor) – 大小为 (N, 4) 的张量,包含 (xmin, ymin, xmax, ymax) 格式的边界框。请注意, 这些框是相对于图像的绝对坐标。换句话说:0 <= xmin < xmax < W0 <= ymin < ymax < H

  • labelsList[str]) – 包含边界框标签的列表。

  • 颜色Union[List[Union[strTuple[intintint]]], strTuple[intintint]]) – 包含颜色的列表 或所有边界框的单一颜色。颜色可以表示为 strTuple[int, int, int]。

  • fillbool) – 如果为 True,则使用指定颜色填充边界框。

  • - 宽度int) - 边界框的宽度。

  • fontstr) – 包含 TrueType 字体的文件名。如果在此文件名中找不到该文件,则加载程序可能会 还可以在其他目录中搜索,例如 Windows 上的 fonts/ 目录或 macOS 上的 /Library/Fonts//System/Library/Fonts/~/Library/Fonts/。

  • font_sizeint) – 请求的字体大小(以磅为单位)。

返回

dtype uint8 的图像张量,绘制了边界框。

返回类型

img (张量 [C, H, W])

使用 的示例 :draw_bounding_boxes

torchvision.utils.draw_segmentation_masks(图片Torch。Tensor掩码torch。张量alpha float = 0.8colors 可选[List[Union[str Tuple[int int int]]]] = Nonetorch.张量[来源]

在给定的 RGB 图像上绘制分割蒙版。 输入图像的值应为 uint8,介于 0 和 255 之间。

参数
  • imageTensor) - 形状为 (3, H, W) 且 dtype 为 uint8 的张量。

  • masksTensor) - 形状为 (num_masks, H, W) 或 (H, W) 且 dtype bool 的张量。

  • alphafloat) - 介于 0 和 1 之间的浮点数,表示蒙版的透明度。 0 表示完全透明,1 表示无透明度。

  • colorslistNone) – 包含掩码颜色的列表。颜色可以 表示为 PIL 字符串,例如 “red” 或 “#FF00FF”,或 RGB 元组,例如 . 当具有形状 (H, W) 的单个条目时,您可以传递单个颜色而不是列表 替换为一个元素。默认情况下,将为每个蒙版生成随机颜色。(240, 10, 157)masks

返回

Image Tensor,顶部绘制了分割掩码。

返回类型

img (张量 [C, H, W])

使用 的示例 :draw_segmentation_masks

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源