目录

torcharrow.Column

A 是 1 维手电筒。Tensor like 数据结构包含 元素。它还支持非数字类型,例如 string、 list、struct 中。

数据类型

TorchArrow 为 module 中的 column 定义了以下数据类型(缩写如下表所示):torcharrow.dtypesdt

数据类型

DTYPE

32 位浮点

dt.float32dt.Float32(nullable)

64 位浮点

dt.float64dt.Float64(nullable)

8 位有符号整数

dt.int8dt.Int8(nullable)

16 位有符号整数

dt.int16dt.Int16(nullable)

32 位有符号整数

dt.int32dt.Int32(nullable)

64 位有符号整数

dt.int64dt.Int64(nullable)

布尔

dt.booleandt.Boolean(nullable)

字符串

dt.stringdt.String(nullable)

列表

dt.List(item_dtype, nullable)

结构

dt.Struct(fields, nullable)

列类参考

torcharrow 的 TorchArrow 中。
列。DTYPE

数据类型

列。装置

分配 A 或将要分配的设备。

列。长度

返回包含 null 值的行数

列。null_count

返回 null 值的个数

Column.head

返回前 n 行。

列.尾

返回最后 n 行。

Column.cast

将 Column 强制转换为给定的 dtype

Column.is_valid_at

(实验性 API)返回索引 i 处的数据是否有效,即非 null

Column.append

返回附加了值的列/数据帧。

Column.isin

检查列中的每个元素是否都包含在 values 中。

列.all

返回所有非 null 元素是否为 True

列.any

返回是否有任何非 null 元素为 True

Column.map

根据输入对应关系映射行。

列.filter

选择 predicate 为 True 的行。

Column.flatmap

根据输入对应关系将行映射到行列表 如果结果类型 != 项类型,则需要 dtype。

Column.transform

与 map() 类似,但一次在小批量行上调用可调用对象。

Column.fill_null

使用指定方法填充 null 值。

Column.drop_null

返回删除了行的列/帧,其中一行包含任何或所有 null。

Column.drop_duplicates

(实验性 API)从行/帧中删除重复值,但保留第一个、最后一个、无

Column.to_arrow

将自身转换为箭头数组

Column.to_tensor

转换为 PyTorch 容器(Tensor、PackedList、PackedMap 等)

Column.to_pylist

转换为普通 Python 容器(标量或容器列表)

Column.to_pandas

将自身转换为 Pandas 系列

NumericalColumn 类参考

torcharrow 的 TorchArrow 中。NumericalColumn (数值列)

NumericalColumn.abs

序列中每个元素的绝对值。

NumericalColumn.ceil

将每个值向上舍入到最小整数

NumericalColumn.floor

将每个值向下舍入到最大整数值

NumericalColumn.round

将数据中的每个值四舍五入到给定的小数位数。

NumericalColumn.log

返回一个包含元素的自然对数的新列

NumericalColumn.describe

生成描述性统计信息。

NumericalColumn.min

返回非 null 值的最小值。

NumericalColumn.max

返回非 null 值的最大值。

NumericalColumn.sum

返回非 null 值的总和。

NumericalColumn.mean

返回非 null 值的平均值。

NumericalColumn.std

返回数据的 stddev 值。

NumericalColumn.median

返回数据中值的中位数。

StringColumn 类参考

torcharrow 的 TorchArrow 中。StringColumn

istring_column。StringMethods.length

计算 Column 中每个元素的长度。

istring_column。StringMethods.slice 的

从 Column 中的每个元素中切片子字符串。

istring_column。字符串方法.split

在给定的分隔符/分隔符周围拆分字符串。

istring_column。字符串方法.strip

删除前导和尾随空格。

istring_column。字符串方法.isalpha

如果字符串是字母字符串,则返回 True,否则返回 False。

istring_column。StringMethods.isnumeric

如果所有字符都是数字,则返回 True,否则返回 False。

istring_column。StringMethods.isalnum

如果字符串中的所有字符都是字母数字(字母或数字),则返回 True,否则返回 False。

istring_column。StringMethods.isdigit

如果字符串中的所有字符都是数字,则返回 True,否则返回 False。

istring_column。StringMethods.isdecimal 函数

如果字符串仅包含十进制数字(从 0 到 9),则返回 True,否则返回 False。

istring_column。StringMethods.isspace

返回 True,字符串中的所有字符都是空格,否则为 False。

istring_column。StringMethods.is较慢

如果非空字符串为小写,则返回 True,否则返回 False。

istring_column。StringMethods.isupper

如果非空字符串为大写,则返回 True,否则返回 False。

istring_column。StringMethods.istitle

如果字符串的每个单词都以大写字母开头,则返回 True,否则返回 False。

istring_column。StringMethods.lower

将 Column 中的字符串转换为小写。

istring_column。StringMethods.upper

将 Column 中的字符串转换为大写。

istring_column。StringMethods.starts替换为

测试每个 string 元素的开头是否与模式匹配。

istring_column。StringMethods.ends替换为

测试每个 string 元素的结尾是否与模式匹配。

istring_column。StringMethods.count

计算每个列字符串中 pattern 的出现次数

istring_column。StringMethods.find

返回 Column 中每个字符串的最低索引。

istring_column。StringMethods.replace

替换 Column 中出现的每个 pattern。

istring_column。字符串方法.match

确定每个字符串是否与正则表达式匹配

istring_column。StringMethods.contains 文件

如果 pattern 包含在字符串中,则测试每个项目;返回一个布尔值

istring_column。StringMethods.findall

为每个项目查找所有出现的 pattern (参见 re.findall() )

ListColumn 类参考

torcharrow 的 TorchArrow 中。ListColumn 列表列

ilist_column。ListMethods.length

计算 Column 中每个元素的长度。

ilist_column。ListMethods.slice 的

从列中的每个元素切片子列表

ilist_column。ListMethods.vmap 文件

(实验性 API)矢量化地图。

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源