WizardLM基于 LLaMA 的微调大语言模型

联合创作 · 2023-09-25 23:23

WizardLM 是一个经过微调的 7B LLaMA 模型。它通过大量具有不同难度的指令跟随对话进行微调。这个模型的新颖之处在于使用了 LLM 来自动生成训练数据。

WizardLM 模型使用一种名为 Evol-Instruct(是一种使用 LLM 代人类自主批生成各种难度等级和技术范围的开放指令,以提高 LLM 能力的新方法)的新方法,通过 70k 个计算机生成的指令进行训练,该方法生成具有不同难度级别的指令。

Evol-Instruct 使用以下五个操作来扩展提示:

  • 添加约束

  • 深化

  • 具体化

  • 增加推理步骤

  • 复杂输入

这些操作按顺序应用于初始指令以使其更加复杂,回复由 LLM 生成。

 

浏览 10
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报