目录

torchtune.models

llama3 & llama3.1

来自Llama3 系列的所有模型。

下载 Llama3-8B-Instruct 模型:

tune download meta-llama/Meta-Llama-3-8B-Instruct --hf-token <HF_TOKEN>

下载 Llama3-70B-Instruct 模型:

tune download meta-llama/Meta-Llama-3-70B-Instruct --hf-token <HF_TOKEN> --ignore-patterns "original/consolidated*"

要下载上述模型的Llama3.1权重,您可以从Meta-Llama-3.1-8B-InstructMeta-Llama-3.1-70B-Instruct下载。

llama3.llama3

构建与 Llama3 模型关联的解码器。

llama3.lora_llama3

返回一个应用了LoRA的Llama3版本(TransformerDecoder()的一个实例),该版本基于传入的配置。

llama3.llama3_8b

用于创建使用默认 80 亿参数值初始化的 Llama3 模型的构建器。

llama3.lora_llama3_8b

用于创建启用 LoRA 的 Llama3 8B 模型的构建器。

llama3.qlora_llama3_8b

用于创建启用 QLoRA 的 Llama3 8B 模型的构建器。

llama3.llama3_70b

用于创建使用默认 70B 参数值初始化的 Llama3 模型的构建器。

llama3.lora_llama3_70b

用于创建启用 LoRA 的 Llama3 70B 模型的构建器。

llama3.qlora_llama3_70b

用于创建启用 QLoRA 的 Llama3 70B 模型的构建器。

llama3.llama3_tokenizer

Llama3 的分词器。

llama3.Llama3Tokenizer

tiktoken tokenizer 配置了 Llama3 Instruct 的特殊标记,如 https://llama.meta.com/docs/model-cards-and-prompt-formats/meta-llama-3 所述

llama3_1.llama3_1

构建与 Llama3.1 模型关联的解码器。

llama3_1.lora_llama3_1

返回一个应用了LoRA的Llama3.1版本(TransformerDecoder()的一个实例),该版本基于传入的配置。

llama3_1.llama3_1_8b

用于创建使用默认 80 亿参数值初始化的 Llama3.1 模型的构建器。

llama3_1.lora_llama3_1_8b

用于创建启用 LoRA 的 Llama3.1 8B 模型的构建器。

llama3_1.qlora_llama3_1_8b

用于创建启用 QLoRA 的 Llama3.1 8B 模型的构建器。

llama3_1.llama3_1_70b

用于创建使用默认 70B 参数值初始化的 Llama3.1 模型的构建器。

llama3_1.lora_llama3_1_70b

用于创建启用 LoRA 的 Llama3.1 70B 模型的构建器。

llama3_1.qlora_llama3_1_70b

用于创建启用 QLoRA 的 Llama3.1 70B 模型的构建器。

注意

Llama3.1 分词器重用了 llama3.llama3_tokenizer 构建器类。

llama2

Llama2系列的所有模型。

下载 Llama2-7B 模型:

tune download meta-llama/Llama-2-7b-hf --hf-token <HF_TOKEN>

要下载 Llama2-13B 模型:

tune download meta-llama/Llama-2-13b-hf --hf-token <HF_TOKEN>

要下载 Llama2-70B 模型:

tune download meta-llama/Llama-2-70b-hf --hf-token <HF_TOKEN>

llama2.llama2

构建与 Llama2 模型关联的解码器。

llama2.lora_llama2

返回一个应用了LoRA的Llama2版本(TransformerDecoder()的一个实例),该版本基于传入的配置。

llama2.llama2_7b

用于创建 Llama2 模型的构建器,使用来自 https://arxiv.org/abs/2307.09288 的默认 7B 参数值进行初始化

llama2.lora_llama2_7b

用于创建启用 LoRA 的 Llama2 7B 模型的构建器。

llama2.qlora_llama2_7b

用于创建启用 QLoRA 的 Llama2 7B 模型的构建器。

llama2.llama2_13b

用于创建 Llama2 模型的构建器,使用来自 https://arxiv.org/abs/2307.09288 的默认 13B 参数值进行初始化

llama2.lora_llama2_13b

用于创建启用 LoRA 的 Llama2 13B 模型的构建器。

llama2.qlora_llama2_13b

用于创建启用 QLoRA 的 Llama2 13B 模型的构建器。

llama2.llama2_70b

用于创建 Llama2 模型的构建器,使用来自 https://arxiv.org/abs/2307.09288 的默认 70B 参数值进行初始化

llama2.lora_llama2_70b

用于创建启用 LoRA 的 Llama2 70B 模型的构建器。

llama2.qlora_llama2_70b

用于创建启用 QLoRA 的 Llama2 70B 模型的构建器。

llama2.llama2_tokenizer

Llama2 的分词器。

llama2.Llama2Tokenizer

Llama2 的 SentencePiece 分词器实现。

代码大模型

来自 Code Llama 系列 的模型。

要下载 CodeLlama-7B 模型:

tune download codellama/CodeLlama-7b-hf --hf-token <HF_TOKEN>

code_llama2.code_llama2_7b

用于创建 Code-Llama2 模型的构建器,使用来自 https://arxiv.org/pdf/2308.12950.pdf 的默认 7B 参数值进行初始化

code_llama2.lora_code_llama2_7b

用于创建启用 LoRA 的 Code-Llama2 7B 模型的构建器。

code_llama2.qlora_code_llama2_7b

用于创建启用 QLoRA 的 Code-Llama2 7B 模型的构建器。

code_llama2.code_llama2_13b

用于创建 Code-Llama2 模型的构建器,使用来自 https://arxiv.org/pdf/2308.12950.pdf 的默认 13B 参数值进行初始化

code_llama2.lora_code_llama2_13b

用于创建启用 LoRA 的 Code-Llama2 13B 模型的构建器。

code_llama2.qlora_code_llama2_13b

用于创建启用 QLoRA 的 Code-Llama2 13B 模型的构建器。

code_llama2.code_llama2_70b

用于创建 Code-Llama2 模型的构建器,使用来自 https://arxiv.org/pdf/2308.12950.pdf 的默认 70B 参数值进行初始化

code_llama2.lora_code_llama2_70b

用于创建启用 LoRA 的 Code-Llama2 70B 模型的构建器。

code_llama2.qlora_code_llama2_70b

用于创建启用 QLoRA 的 Code-Llama2 70B 模型的构建器。

phi-3

来自 Phi-3 mini 系列 的模型。

要下载 Phi-3 Mini 4k 指令模型:

tune download microsoft/Phi-3-mini-4k-instruct --hf-token <HF_TOKEN> --ignore-patterns ""

phi3.phi3

param vocab_size:

词汇表中的 token 数量。

phi3.lora_phi3

返回一个应用了LoRA的Phi3版本(TransformerDecoder()的一个实例),该版本基于传入的配置。

phi3.phi3_mini

用于创建 Phi3 Mini 4K Instruct 模型的构建器。

phi3.lora_phi3_mini

用于创建启用 LoRA 的 Phi3 Mini(38 亿参数)模型的构建器。

phi3.qlora_phi3_mini

用于创建启用 QLoRA 的 Phi3 mini 模型的构建器。

phi3.phi3_mini_tokenizer

Phi-3 Mini 分词器。

phi3.Phi3MiniTokenizer

使用Phi3 Mini的特殊标记配置的SentencePiece分词器。

mistral

所有来自 Mistral AI 系列 的模型。

要下载 Mistral 7B v0.1 模型:

tune download mistralai/Mistral-7B-v0.1 --hf-token <HF_TOKEN>

mistral.mistral

构建与 Mistral 模型关联的解码器。

mistral.lora_mistral

返回一个应用了LoRA的Mistral版本(TransformerDecoder()的一个实例),该版本基于传入的配置。

mistral.mistral_classifier

构建一个带有附加分类层的基座 Mistral 模型。

mistral.lora_mistral_classifier

返回一个应用了LoRA的Mistral分类器版本(TransformerDecoder()的实例),LoRA应用于其自注意力模块中的某些线性层。

mistral.mistral_7b

用于创建 Mistral 7B 模型的构建器,使用来自 https://mistral.ai/news/announcing-mistral-7b/ 的默认 7B 参数值进行初始化

mistral.lora_mistral_7b

用于创建启用 LoRA 的 Mistral 7B 模型的构建器。

mistral.qlora_mistral_7b

用于创建启用 QLoRA 的 Mistral 模型的构建器。

mistral.mistral_classifier_7b

用于创建初始化为默认7B参数值的Mistral 7B分类模型的构建器,参数值来源于:https://huggingface.co/Ray2333/reward-model-Mistral-7B-instruct-Unified-Feedback

mistral.lora_mistral_classifier_7b

用于创建带有LoRA功能的Mistral分类器7B模型的构建器。

mistral.qlora_mistral_classifier_7b

用于创建启用 QLoRA 的 Mistral 分类器模型的构建器。

mistral.mistral_tokenizer

Mistral 模型的词元化器。

mistral.MistralTokenizer

Mistral 的 SentencePiece 分词器实现

gemma

Gemma系列的20亿参数和70亿参数模型。

下载Gemma 2B模型:

tune download google/gemma-2b --hf-token <HF_TOKEN> --ignore-patterns ""

要下载 Gemma 7B 模型:

tune download google/gemma-7b --hf-token <HF_TOKEN> --ignore-patterns "gemma-7b.gguf"

gemma.gemma

构建与 Gemma 模型关联的解码器。

gemma.lora_gemma

根据传入的配置,返回一个应用了 LoRA 的 Gemma 版本。

gemma.gemma_2b

用于创建Gemma 2B模型的构建器,使用默认的2B参数值初始化: https://blog.google/technology/developers/gemma-open-models/

gemma.lora_gemma_2b

用于创建启用 LoRA 的 Gemma 2B 模型的构建器。

gemma.qlora_gemma_2b

用于创建启用 QLoRA 的 Gemma 模型的构建器。

gemma.gemma_7b

用于创建Gemma 7B模型的构建器,使用默认的7b参数值初始化: https://blog.google/technology/developers/gemma-open-models/

gemma.lora_gemma_7b

用于创建启用 LoRA 的 Gemma 7B 模型的构建器。

gemma.qlora_gemma_7b

用于创建启用 QLoRA 的 Gemma 模型的构建器。

gemma.gemma_tokenizer

Gemma 的分词器。

gemma.GemmaTokenizer

Gemma 的 SentencePiece 分词器实现

文档

访问 PyTorch 的全面开发人员文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源