目录

torchtune.data

文本模板

指示提示和聊天提示的模板。包括不同数据集的一些特定格式 和模型。

InstructTemplate 模板

指令模板的接口。

羊驼InstructTemplate

Alpaca 样式数据集的提示模板。

语法错误校正模板

语法更正数据集的提示模板。

SummarizeTemplate

提示模板为摘要任务设置数据集格式。

StackExchangedPairedTemplate

首选项数据集的提示模板,类似于 StackExchangedPaired。

聊天格式

聊天格式的接口。

ChatMLFormat

OpenAI 的聊天模型使用的聊天标记语言

Llama2Chat格式

使用 Llama2 预训练中使用的适当标签对人工和系统提示进行格式化的聊天格式。

MistralChatFormat

根据 Mistral 的 instruct 模型进行格式设置。

类型

消息

此数据类表示 instruction 或 chat 数据集中的单个消息。

变换 器

将数据从常见 JSON 格式转换为 torchtune

get_sharegpt_messages

将遵循 ShareGPT json 结构的聊天示例转换为 torchtune 的结构

get_openai_messages

将遵循 OpenAI API json 结构的聊天示例转换为 torchtune 的结构

辅助函数

用于修改数据的其他帮助程序函数。

validate_messages

给定消息列表,确保消息形成有效的来回对话。

截断

将令牌列表截断为最大长度。

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源