torchtune.models¶
羊驼3 & 羊驼3.1¶
所有型号均来自 Llama3 系列。
要下载 Llama3-8B-Instruct 模型:
tune download meta-llama/Meta-Llama-3-8B-Instruct --hf-token <HF_TOKEN>
要下载 Llama3-70B-Instruct 模型:
tune download meta-llama/Meta-Llama-3-70B-Instruct --hf-token <HF_TOKEN> --ignore-patterns "original/consolidated*"
要下载上述模型的 Llama3.1 权重,您可以从 Meta-Llama-3.1-8B-Instruct 或 Meta-Llama-3.1-70B-Instruct 下载。
构建与 Llama3 模型关联的解码器。 |
|
用于创建使用默认 8b 参数值初始化的 Llama3 模型的构建器。 |
|
用于创建启用了 LoRA 的 Llama3 8B 模型的生成器。 |
|
用于创建启用了 QLoRA 的 Llama3 8B 模型的生成器。 |
|
用于创建使用默认 70B 参数值初始化的 Llama3 模型的构建器。 |
|
用于创建启用了 LoRA 的 Llama3 70B 模型的生成器。 |
|
用于创建启用了 QLoRA 的 Llama3 70B 模型的构建器。 |
|
Llama3 的 Tokenizer。 |
|
tiktoken token,配置了 Llama3 Instruct 的特殊令牌,如 https://llama.meta.com/docs/model-cards-and-prompt-formats/meta-llama-3 中所述 |
|
构建与 Llama3.1 模型关联的解码器。 |
|
用于创建使用默认 8b 参数值初始化的 Llama3.1 模型的构建器。 |
|
用于创建启用了 LoRA 的 Llama3.1 8B 模型的构建器。 |
|
用于创建启用了 QLoRA 的 Llama3.1 8B 模型的构建器。 |
|
用于创建使用默认 70B 参数值初始化的 Llama3.1 模型的构建器。 |
|
用于创建启用了 LoRA 的 Llama3.1 70B 模型的构建器。 |
|
用于创建启用了 QLoRA 的 Llama3.1 70B 模型的构建器。 |
注意
Llama3.1 分词器重用 llama3.llama3_tokenizer builder 类。
美洲驼2¶
所有型号均来自 Llama2 系列。
要下载 Llama2-7B 模型:
tune download meta-llama/Llama-2-7b-hf --hf-token <HF_TOKEN>
要下载 Llama2-13B 型号:
tune download meta-llama/Llama-2-13b-hf --hf-token <HF_TOKEN>
要下载 Llama2-70B 型号:
tune download meta-llama/Llama-2-70b-hf --hf-token <HF_TOKEN>
构建与 Llama2 模型关联的解码器。 |
|
用于创建 Llama2 模型的构建器,该模型使用 https://arxiv.org/abs/2307.09288 中的默认 7B 参数值进行初始化 |
|
用于创建启用了 LoRA 的 Llama2 7B 模型的生成器。 |
|
用于创建启用了 QLoRA 的 Llama2 7B 模型的生成器。 |
|
用于创建 Llama2 模型的生成器,该模型使用 https://arxiv.org/abs/2307.09288 中的默认 13B 参数值进行初始化 |
|
用于创建启用了 LoRA 的 Llama2 13B 模型的构建器。 |
|
用于创建启用了 QLoRA 的 Llama2 13B 模型的生成器。 |
|
用于创建 Llama2 模型的构建器,该模型使用 https://arxiv.org/abs/2307.09288 中的默认 70B 参数值进行初始化 |
|
用于创建启用了 LoRA 的 Llama2 70B 模型的生成器。 |
|
用于创建启用了 QLoRA 的 Llama2 70B 模型的生成器。 |
|
Llama2 的 Tokenizer。 |
|
Llama2 的 SentencePiece 分词器实现。 |
代码羊驼¶
来自 Code Llama 系列的模型。
要下载 CodeLlama-7B 模型:
tune download codellama/CodeLlama-7b-hf --hf-token <HF_TOKEN>
用于创建 Code-Llama2 模型的构建器,该模型使用 https://arxiv.org/pdf/2308.12950.pdf 中的默认 7B 参数值进行初始化 |
|
用于创建启用了 LoRA 的 Code-Llama2 7B 模型的构建器。 |
|
用于创建启用了 QLoRA 的 Code-Llama2 7B 模型的生成器。 |
|
用于创建 Code-Llama2 模型的构建器,该模型使用 https://arxiv.org/pdf/2308.12950.pdf 中的默认 13B 参数值进行初始化 |
|
用于创建启用了 LoRA 的 Code-Llama2 13B 模型的生成器。 |
|
用于创建启用了 QLoRA 的 Code-Llama2 13B 模型的构建器。 |
|
用于创建 Code-Llama2 模型的构建器,该模型使用 https://arxiv.org/pdf/2308.12950.pdf 中的默认 70B 参数值进行初始化 |
|
用于创建启用了 LoRA 的 Code-Llama2 70B 模型的生成器。 |
|
用于创建启用了 QLoRA 的 Code-Llama2 70B 模型的构建器。 |
PHI-3¶
来自 Phi-3 mini 系列的型号。
要下载 Phi-3 Mini 4k 指示模型:
tune download microsoft/Phi-3-mini-4k-instruct --hf-token <HF_TOKEN> --ignore-patterns ""
|
|
用于创建 Phi3 Mini 4K Instruct 模型的构建器。 |
|
用于创建启用了 LoRA 的 Phi3 Mini (3.8b) 模型的生成器。 |
|
用于创建启用了 QLoRA 的 Phi3 迷你模型的构建器。 |
|
Phi-3 迷你分词器。 |
|
SentencePiece 分词器配置了 Phi3 Mini 的特殊分词器。 |
米斯特拉尔¶
所有型号均来自 Mistral AI 系列。
要下载 Mistral 7B v0.1 模型:
tune download mistralai/Mistral-7B-v0.1 --hf-token <HF_TOKEN>
构建与 mistral 模型关联的解码器。 |
|
构建一个添加了分类层的基本 mistral 模型。 |
|
用于创建使用 https://mistral.ai/news/announcing-mistral-7b/ 中的默认 7b 参数值初始化的 Mistral 7B 模型的生成器 |
|
用于创建启用了 LoRA 的 Mistral 7B 模型的生成器。 |
|
用于创建启用了 QLoRA 的 Mistral 模型的构建器。 |
|
用于创建 Mistral 7B 分类器模型的构建器,该模型使用默认 7b 参数值初始化:https://huggingface.co/Ray2333/reward-model-Mistral-7B-instruct-Unified-Feedback |
|
用于创建启用了 LoRA 的 Mistral 分类器 7B 模型的构建器。 |
|
用于创建启用了 QLoRA 的 Mistral 分类器模型的构建器。 |
|
用于 Mistral 模型的 Tokenizer。 |
|
Mistral 的 SentencePiece 分词器实现 |
杰玛¶
来自 Gemma 系列的 2B 和 7B 尺寸模型。
要下载 Gemma 2B 模型,请执行以下操作:
tune download google/gemma-2b --hf-token <HF_TOKEN> --ignore-patterns ""
要下载 Gemma 7B 模型,请执行以下操作:
tune download google/gemma-7b --hf-token <HF_TOKEN> --ignore-patterns "gemma-7b.gguf"
构建与 gemma 模型关联的解码器。 |
|
返回基于传入配置应用了 LoRA 的 Gemma 版本。 |
|
用于创建 Gemma 2B 模型的构建器,该模型使用默认 2b 参数值初始化,来自:https://blog.google/technology/developers/gemma-open-models/ |
|
用于创建启用了 LoRA 的 Gemma 2B 模型的生成器。 |
|
用于创建启用了 QLoRA 的 Gemma 模型的构建器。 |
|
用于创建 Gemma 7B 模型的构建器,该模型使用默认 7b 参数值初始化,例如:https://blog.google/technology/developers/gemma-open-models/ |
|
用于创建启用了 LoRA 的 Gemma 7B 模型的生成器。 |
|
用于创建启用了 QLoRA 的 Gemma 模型的构建器。 |
|
Gemma 的 Tokenizer。 |
|
Gemma 的 SentencePiece 分词器实现 |