配方概述¶
配方是 torchtune 用户的主要入口点。 这些可以被认为是可修改的、专注于与 LLM 交互的脚本,包括微调、 推理、评估和量化。
每个配方由三个部分组成:
可配置的参数,通过 yaml 配置和命令行覆盖指定
配方脚本,将所有内容放在一起的入口点,包括解析和验证配置、设置环境以及正确使用配方类
Recipe 类,微调所需的核心逻辑,通过一组 API 公开
注意
要了解有关“示例”概念的更多信息,请查看我们的技术深入探讨:什么是示例?。
微调¶
我们的示例包括:
单设备完全微调
分布式完全微调
分布式 LoRA 微调
近端策略优化 (PPO)
如需完整列表,请运行:
tune ls
注意
我们的配方文档目前正在构建中。请随时关注我们的跟踪器中的进度 问题在这里。