中国人民大学《大语言模型》书籍中文版开放下载!还配套代码工具库~

共 1812字,需浏览 4分钟

 ·

2024-04-29 11:00

大语言模型综述文章《A Survey of Large Language Models》团队终于出书啦!而且是中文版——《大语言模型》!这本书整理呈现了大模型技术框架和路线图,是一本非常好的入门书籍。🧿🧿🧿 此外,官方不仅发布了电子版 PDF 下载链接,还提供了配套资源。点赞 👍图书下载 → [大语言模型]

⬆️关注公众号,后台回复:大语言模型

以下是书籍大纲,如果有你感兴趣的内容,可以直接下载和阅读啦!

第一部分 背景与基础知识 第一章 引言 -   1.1 语言模型的发展历程 -   1.2 大语言模型的能力特点 -   1.3 大语言模型关键技术概览 -   1.4 大语言模型对科技发展的影响 -   1.5 本书的内容组织 第二章 基础介绍 -   2.1 大语言模型的构建过程 -   2.2 扩展法则 -   2.3 涌现能力 -   2.4 GPT 系列模型的技术演变 第三章 大语言模型资源 -   3.1 公开可用的模型检查点或 API -   3.2 常用的预训练数据集 -   3.3 常用微调数据集 -   3.4 代码库资源 第二部分 预训练 第四章 数据准备 -   4.1 数据来源 -   4.2 数据预处理 -   4.3 词元化 (分词) -   4.4 数据调度 第五章 模型架构 -   5.1 Transformer 模型 -   5.2 详细配置 -   5.3 主流架构 -   5.4 长上下文模型 -   5.5 新型模型架构 第六章 模型预训练 -   6.1 预训练任务 -   6.2 优化参数设置 -   6.3 可扩展的训练技术 -   6.4 模型参数量计算与效率分析 -   6.5 预训练代码实践 第三部分 微调与对齐 第七章 指令微调 -   7.1 指令数据的构建 -   7.2 指令微调的训练策略 -   7.3 参数高效的模型微调 -   7.4 代码实践与分析 第八章 人类对齐 -   8.1 人类对齐的背景与标准 -   8.2 基于人类反馈的强化学习 -   8.3 非强化学习的对齐方法 -   8.4 关于 SFT 和 RLHF 的进一步讨论 第四部分 大模型使用 第九章 解码与部署 -   9.1 解码策略 -   9.2 解码加速算法 -   9.3 低资源部署策略 -   9.4 其他模型压缩方法 第十章 提示学习 -   10.1 基础提示 -   10.2 上下文学习 -   10.3 思维链提示 第十一章 规划与智能体 -   11.1 基于大语言模型的规划 -   11.2 基于大语言模型的智能体 第五部分 评测与应用 第十二章 评测 -   12.1 评测指标与评测方法 -   12.2 基础能力评测 -   12.3 高级能力评测 -   12.4 公开综合评测体系 第十三章 应用 -   13.1 大语言模型在研究领域的应用 -   13.2 大语言模型在专业领域的应用

图书下载 → [大语言模型]

⬆️关注公众号,后台回复:大语言模型

   
如此“爬虫”?代码全省了
用 R Bookdown 做本书,上线
吴恩达最新短课,大模型系列
ChatGPT、大模型、AI资料分享群
本地运行 Llama 3,可以中文,但不强
Jekyll + Vercel搭建个人博客,完整教程

浏览 106
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报