torcharrow.Column¶
A 是 1 维手电筒。Tensor like 数据结构包含
元素。它还支持非数字类型,例如 string、
list、struct 中。
数据类型¶
TorchArrow 为 module 中的 column 定义了以下数据类型(缩写如下表所示):torcharrow.dtypes
dt
数据类型 |
DTYPE |
---|---|
32 位浮点 |
|
64 位浮点 |
|
8 位有符号整数 |
|
16 位有符号整数 |
|
32 位有符号整数 |
|
64 位有符号整数 |
|
布尔 |
|
字符串 |
|
列表 |
|
结构 |
|
列类参考¶
- 类 torcharrow 的 TorchArrow 中。列¶
- 列。DTYPE¶
- 列。装置¶
- 列。长度¶
返回包含 null 值的行数
- 列。null_count¶
返回 null 值的个数
返回前 n 行。 |
|
返回最后 n 行。 |
|
将 Column 强制转换为给定的 dtype |
|
(实验性 API)返回索引 i 处的数据是否有效,即非 null |
|
返回附加了值的列/数据帧。 |
|
检查列中的每个元素是否都包含在 values 中。 |
|
返回所有非 null 元素是否为 True |
|
返回是否有任何非 null 元素为 True |
|
根据输入对应关系映射行。 |
|
选择 predicate 为 True 的行。 |
|
根据输入对应关系将行映射到行列表 如果结果类型 != 项类型,则需要 dtype。 |
|
与 map() 类似,但一次在小批量行上调用可调用对象。 |
|
使用指定方法填充 null 值。 |
|
返回删除了行的列/帧,其中一行包含任何或所有 null。 |
|
(实验性 API)从行/帧中删除重复值,但保留第一个、最后一个、无 |
|
将自身转换为箭头数组 |
|
转换为 PyTorch 容器(Tensor、PackedList、PackedMap 等) |
|
转换为普通 Python 容器(标量或容器列表) |
|
将自身转换为 Pandas 系列 |
NumericalColumn 类参考¶
- 类 torcharrow 的 TorchArrow 中。NumericalColumn (数值列)¶
序列中每个元素的绝对值。 |
|
将每个值向上舍入到最小整数 |
|
将每个值向下舍入到最大整数值 |
|
将数据中的每个值四舍五入到给定的小数位数。 |
|
返回一个包含元素的自然对数的新列 |
|
生成描述性统计信息。 |
|
返回非 null 值的最小值。 |
|
返回非 null 值的最大值。 |
|
返回非 null 值的总和。 |
|
返回非 null 值的平均值。 |
|
返回数据的 stddev 值。 |
|
返回数据中值的中位数。 |
StringColumn 类参考¶
- 类 torcharrow 的 TorchArrow 中。StringColumn¶
计算 Column 中每个元素的长度。 |
|
从 Column 中的每个元素中切片子字符串。 |
|
在给定的分隔符/分隔符周围拆分字符串。 |
|
删除前导和尾随空格。 |
|
如果字符串是字母字符串,则返回 True,否则返回 False。 |
|
如果所有字符都是数字,则返回 True,否则返回 False。 |
|
如果字符串中的所有字符都是字母数字(字母或数字),则返回 True,否则返回 False。 |
|
如果字符串中的所有字符都是数字,则返回 True,否则返回 False。 |
|
如果字符串仅包含十进制数字(从 0 到 9),则返回 True,否则返回 False。 |
|
返回 True,字符串中的所有字符都是空格,否则为 False。 |
|
如果非空字符串为小写,则返回 True,否则返回 False。 |
|
如果非空字符串为大写,则返回 True,否则返回 False。 |
|
如果字符串的每个单词都以大写字母开头,则返回 True,否则返回 False。 |
|
将 Column 中的字符串转换为小写。 |
|
将 Column 中的字符串转换为大写。 |
|
测试每个 string 元素的开头是否与模式匹配。 |
|
测试每个 string 元素的结尾是否与模式匹配。 |
|
计算每个列字符串中 pattern 的出现次数 |
|
返回 Column 中每个字符串的最低索引。 |
|
替换 Column 中出现的每个 pattern。 |
|
确定每个字符串是否与正则表达式匹配 |
|
如果 pattern 包含在字符串中,则测试每个项目;返回一个布尔值 |
|
为每个项目查找所有出现的 pattern (参见 re.findall() ) |
ListColumn 类参考¶
- 类 torcharrow 的 TorchArrow 中。ListColumn 列表列¶
计算 Column 中每个元素的长度。 |
|
从列中的每个元素切片子列表 |
|
(实验性 API)矢量化地图。 |