Stanford Alpaca指令调优的 LLaMA 模型

联合创作 · 2023-09-25 23:09

Stanford Alpaca（斯坦福 Alpaca）是一个指令调优的 LLaMA 模型，从 Meta 的大语言模型 LLaMA 7B 微调而来。

Stanford Alpaca 让 OpenAI 的 text-davinci-003 模型以 self-instruct 方式生成 52K 指令遵循（instruction-following）样本，以此作为 Alpaca 的训练数据。研究团队已将训练数据、生成训练数据的代码和超参数开源，后续还将发布模型权重和训练代码。

GitHub 的仓库包含：

用于微调模型的 52K 数据
生成数据的代码
微调模型的代码

官方示例

浏览 7

点赞

收藏

分享

举报

评论

图片

表情

Stanford Alpaca指令调优的 LLaMA 模型

StanfordAlpaca（斯坦福Alpaca）是一个指令调优的 LLaMA模型，从Meta的大语言模型LLaMA7B微调而来。StanfordAlpaca让OpenAI的text-davinci-

Chinese-LLaMA-Alpaca中文 LLaMA & Alpaca 大模型

Chinese-LLaMA-Alpaca 包含中文 LLaMA 模型和经过指令微调的 Alpaca

Chinese-LLaMA-Alpaca中文 LLaMA & Alpaca 大模型

Chinese-LLaMA-Alpaca包含中文LLaMA模型和经过指令微调的Alpaca大型模型。这些模型在原始LLaMA的基础上，扩展了中文词汇表并使用中文数据进行二次预训练，从而进一步提高了对中

Chinese-LLaMA-Alpaca-2中文 LLaMA & Alpaca 大模型二期项目

本项目基于Meta发布的可商用大模型Llama-2开发，是中文LLaMA&Alpaca大模型的第二期项目，开源了中文LLaMA-2基座模型和Alpaca-2指令精调大模型。这些模型在原版Lla

Chinese-LLaMA-Alpaca-2中文 LLaMA & Alpaca 大模型二期项目

本项目基于Meta发布的可商用大模型Llama-2开发，是中文LLaMA&Alpaca大模型

算法模型调优指南

阿泽的学习笔记

机器学习模型调优总结！

嘉兴优调家居用品有限公司成立于2014-09-17，法定代表人为杨秘，经营范围包括一般项目：家居用品

嘉兴优调家居用品有限公司成立于2014-09-17，法定代表人为杨秘，经营范围包括一般项目：家居用品销售；日用百货销售；针纺织品销售；针纺织品及原料销售；服装服饰零售；服装服饰批发；鞋帽批发；鞋帽零售

机器学习模型调优的三大改进策略！

机器学习实验室

点赞

收藏

分享

举报