目录

torchtext.functional

to_tensor

torchtext.functional 中。to_tensorinput Anypadding_value: Optional[int] = Nonedtype dtype = torch.int64 张量[来源]

将输入转换为 torch 张量

参数
  • padding_valueOptional[int]) – 填充值,使批次中的每个输入的长度等于批次中最长的序列。

  • dtype) – 输出张量

  • inputUnion[List[int]List[List[int]]]) – 令牌 ID 的序列或批次

返回类型

张肌

教程使用:to_tensor
SST-2 使用 XLM-RoBERTa 模型的二进制文本分类

SST-2 使用 XLM-RoBERTa 模型的二进制文本分类

SST-2 使用 XLM-RoBERTa 模型的二进制文本分类

截断

torchtext.functional 中。truncateinput Anymax_seq_len: int Any[来源]

截断输入序列或批处理

参数
  • inputUnion[List[Union[strint]]], List[List[Union[strint]]] – 输入序列或批次截断

  • max_seq_lenint) – 丢弃输入的最大长度

结果

截断序列

返回类型

Union[List[Union[strint]], List[List[Union[strint]]]]

add_token

torchtext.functional 中。add_token输入任意token_id任意开始bool = True 任何[来源]

将令牌添加到序列的开头或结尾

参数
  • inputUnion[List[Union[strint]]], List[List[Union[strint]]]]]) – 输入序列或批次

  • token_idUnion[strint]) – 要添加的令牌

  • beginbooloptional) – 是在开始或结束还是序列处插入标记,默认为 True

结果

将 token_id 添加到 Begin 或 End 或 Input 的序列或批处理

返回类型

Union[List[Union[strint]], List[List[Union[strint]]]]

str_to_int

torchtext.functional 中。str_to_intinput Any Any[来源]

将字符串标记转换为整数(单个序列或批处理)。

参数

inputUnion[List[str]List[List[str]]]) – 输入序列或批次

结果

转换为整数的字符串标记序列或批次

返回类型

Union[List[int], List[List[int]]]

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源