torcharrow.Column¶
A torcharrow.Column 是一个 1 维的 torch.Tensor 类似数据结构,包含
单个数据类型的元素。它还支持非数字类型,如字符串、列表、结构。
数据类型¶
TorchArrow 定义了以下列数据类型,这些数据类型位于模块 torcharrow.dtypes(表单下方缩写为 dt):
数据类型 |
数据类型(dtype) |
|---|---|
32位浮点数 |
|
64位浮点数 |
|
8位有符号整数 |
|
16 位有符号整数 |
|
32位有符号整数 |
|
64位有符号整数 |
|
布尔值 |
|
字符串 |
|
列表 |
|
结构 |
|
列类参考¶
- class torcharrow.Column¶
- Column.dtype¶
数据类型为
torcharrow.Column
- Column.device¶
将在其上分配
torcharrow.Column的设备。
- Column.length¶
返回包含null值的行数
- Column.null_count¶
返回空值的数量
返回第一个 n 行。 |
|
返回最后的 n 行。 |
|
将列转换为指定的数据类型 |
|
(实验性API) 返回索引i的数据是否有效,即非空。 |
|
返回带有附加值的列/数据框。 |
|
检查每一列中的元素是否包含在值中。 |
|
返回所有非空元素是否均为 True |
|
返回是否任何非空元素为真 |
|
根据输入的对应关系映射行。 |
|
选择 predicate 为 True 的行。 |
|
将行映射到根据输入对应关系的列表,如果结果类型与项目类型不同,则需要指定数据类型。 |
|
像map()一样,但每次只对行的批量调用可调函数。 |
|
使用指定的方法填充缺失值。 |
|
返回一个没有行的列/帧,其中一行有任何或所有null值。 |
|
(实验性API) 从行/帧中删除重复值,但保留第一个、最后一个和没有的。 |
|
将self转换为箭头数组 |
|
将数据转换为PyTorch容器(Tensor、PackedList、PackedMap等)。 |
|
将数据转换为普通的Python容器(列表或容器) |
|
将 self 转换为 Pandas Series |
NumericalColumn类参考¶
- class torcharrow.NumericalColumn¶
序列中每个元素的绝对值。 |
|
向上舍入每个值到最小的整数 |
|
向下舍入每个值到最大的整数值 |
|
将数据中的每个值四舍五入到指定的小数位数。 |
|
返回一个新的列,其中包含元素的自然对数 |
|
生成描述性统计。 |
|
返回非空值中的最小值。 |
|
返回非空值中的最大值。 |
|
返回非空值的和。 |
|
返回非空值的平均值。 |
|
返回数据的标准差。 |
|
返回数据中的中位数。 |
StringColumn 类参考¶
- class torcharrow.StringColumn¶
计算每一列元素的长度。 |
|
从每个元素中切片子字符串。 |
|
在给定的分隔符/分隔符周围分割字符串。 |
|
删除首尾空白字符。 |
|
如果字符串是字母串,返回True;否则返回False。 |
|
如果所有字符都是数字,返回True;否则返回False。 |
|
如果字符串中的所有字符都是字母数字(即字母或数字),则返回 True,否则返回 False。 |
|
如果字符串中的所有字符都是数字,返回 True;否则返回 False。 |
|
如果字符串只包含十进制数字(从0到9),返回True;否则返回False。 |
|
所有字符串中的字符都是空格,返回 True;否则返回 False。 |
|
如果非空字符串是小写的,返回 True;否则返回 False。 |
|
如果非空字符串是大写的,返回 True;否则返回 False。 |
|
如果字符串中的每个单词都以大写字母开头,返回 True;否则返回 False。 |
|
将列中的字符串转换为小写。 |
|
将列中的字符串转换为大写。 |
|
测试每个字符串元素的开头是否匹配模式。 |
|
测试每个字符串元素的结尾是否匹配模式。 |
|
在每列的每个字符串中计数模式出现的次数 |
|
返回每个字符串列中的最低索引。 |
|
将列中的模式替换为。 |
|
判断每个字符串是否匹配正则表达式 |
|
测试每个项目,如果模式存在于字符串中,则返回布尔值。 |
|
在每个项目中查找所有模式的出现(请参见 re.findall()) |
列表列类参考¶
- class torcharrow.ListColumn¶
计算每一列元素的长度。 |
|
从每一列的元素中切片子列表 |
|
(实验性API) 向量化映射。 |