torchvision.utils 文件¶

torchvision.utils.make_grid(张量：Union[torch.张量、List[torch.Tensor]]， nrow： int = 8， padding： int = 2， normalize： bool = False， value_range： optional[Tuple[int， int]] = None， scale_each： bool = False， pad_value： int = 0， **kwargs） → torch.张量[来源]¶

制作图像网格。

参数

tensor （Tensor or list） – 形状为（B x C x H x W）的 4D 小批量张量或大小相同的图像列表。
nrow （int， optional） – 网格每行中显示的图像数。最终网格大小为。违约：。(B / nrow, nrow)8
padding （int， optional） - 填充量。违约：。2
normalize （bool，可选） – 如果为 True，则将图像移动到（0， 1）范围内，按指定的最小值和最大值。违约：。rangeFalse
value_range （tuple， optional） – 元组（min， max），其中 min 和 max 是数字，然后，这些数字用于标准化图像。默认情况下，min 和 max 是从张量计算得出的。
scale_each （bool， optional） – 如果，则缩放批次 images 而不是（min， max）覆盖所有图像。违约：。TrueFalse
pad_value （float， optional）（（float， optional）（浮点数，可选） – 填充像素的值。违约：。0

返回

包含图像网格的张量。

返回类型

grid （张量）

使用的示例：make_grid

torchvision.utils.save_image(张量：Union[torch.张量、List[torch.Tensor]]， fp： Union[str， pathlib.路径，BinaryIO]，格式：可选[str] = None，**kwargs） → None[来源]¶

将给定的 Tensor 保存到图像文件中。

参数

tensor （Tensor or list） - 要保存的图像。如果给定一个 mini-batch 张量，通过调用将张量保存为图像网格。make_grid
fp （string or file object） – 文件名或文件对象
format （可选） – 如果省略，则要使用的格式由文件扩展名确定。如果使用 file 对象而不是 filename，则应始终使用此参数。
**kwargs – 其他参数记录在中。make_grid

torchvision.utils.draw_bounding_boxes(图片：Torch。张量，框：torch。张量，标签：可选[List[str]] = 无，颜色：可选[List[Union[str， Tuple[int， int， int]]]] = 无，填充：可选[bool] = False，宽度：int = 1，字体：可选[str] = 无，font_size：int = 10）→ torch。张量[来源]¶

在给定图像上绘制边界框。输入图像的值应为 uint8，介于 0 和 255 之间。如果 fill 为 True，则 Resulting Tensor 应保存为 PNG 图像。

参数

image （Tensor） - 形状为（C x H x W）且数据类型为 uint8 的张量。
boxes （Tensor） – 大小为（N， 4）的张量，包含（xmin， ymin， xmax， ymax）格式的边界框。请注意，这些框是相对于图像的绝对坐标。换句话说：0 <= xmin < xmax < W 和 0 <= ymin < ymax < H。
labels （List[str]） – 包含边界框标签的列表。
colors （List[Union[str， Tuple[int， int， int]]]） – 包含边界框颜色的列表。颜色可以表示为 str 或 Tuple[int， int， int]。
fill （bool） – 如果为 True，则使用指定颜色填充边界框。
- 宽度 （int） - 边界框的宽度。
font （str） – 包含 TrueType 字体的文件名。如果在此文件名中找不到该文件，则加载程序可能会还可以在其他目录中搜索，例如 Windows 上的 fonts/ 目录或 macOS 上的 /Library/Fonts/、/System/Library/Fonts/ 和 ~/Library/Fonts/。
font_size （int） – 请求的字体大小（以磅为单位）。

返回

dtype uint8 的图像张量，绘制了边界框。

返回类型

img （张量 [C， H， W]）

使用的示例：draw_bounding_boxes

torchvision.utils.draw_segmentation_masks(图片：Torch。Tensor，掩码：torch。张量，alpha：float = 0.8，colors：可选[List[Union[str， Tuple[int， int， int]]]] = None） → torch。张量[来源]¶

在给定的 RGB 图像上绘制分割蒙版。输入图像的值应为 uint8，介于 0 和 255 之间。

参数

image （Tensor） - 形状为（3， H， W）且 dtype 为 uint8 的张量。
masks （Tensor） - 形状为（num_masks， H， W）或（H， W）且 dtype bool 的张量。
alpha （float） - 介于 0 和 1 之间的浮点数，表示蒙版的透明度。 0 表示完全透明，1 表示无透明度。
colors （list 或 None） – 包含掩码颜色的列表。颜色可以表示为 PIL 字符串，例如 “red” 或 “#FF00FF”，或 RGB 元组，例如 . 当具有形状（H， W）的单个条目时，您可以传递单个颜色而不是列表替换为一个元素。默认情况下，将为每个蒙版生成随机颜色。(240, 10, 157)masks

返回

Image Tensor，顶部绘制了分割掩码。

返回类型

img （张量 [C， H， W]）

使用的示例：draw_segmentation_masks

torchvision.utils 文件¶

文档

教程

资源