Recipes Overview¶
示例是 torchtune 用户的主要入口。 这些可以被视为可修改的、专注于与大型语言模型交互的脚本,包括微调、 推理、评估和量化。
每个配方由三个部分组成:
可配置参数,通过 yaml 配置文件和命令行覆盖指定
示例脚本,作为入口点将一切整合在一起,包括解析和验证配置、设置环境以及正确使用示例类
Recipe 类,微调所需的核心逻辑,通过一组 API 公开
注意
要了解更多关于“配方”的概念,请查看我们的技术深入解析: 什么是配方?。
微调¶
我们的示例包括:
单设备全量微调
分布式全量微调
分布式 LoRA 微调
直接偏好优化 (DPO)
近端策略优化 (PPO)
如需完整列表,请运行:
tune ls
注意
我们的配方文档目前正在进行中。请随时在我们的跟踪器问题 这里 关注进展。