大厂们在大模型上都快要卷成麻花了
共 3470字,需浏览 7分钟
·
2024-04-16 13:01
清华团队推出 MiniCPM:利用可扩展的训练策略挖掘小模型潜力;
苹果MM1大模型:30B参数,多模态,在预训练指标上达到SOTA;
亚马逊提出大规模视频语言对齐方法VidLA;
英伟达参与,高效视频扩散模型CMD发布;
谷歌、Stability AI新研究:由文本引导生成纹理3D服装;
港大、阿里新研究:只需一张图,轻松即时定制个性化照片;
上海 AI Lab 新研究:将 LVLM 分辨率提升到 4K HD。
大模型正在重构一个新的人工智能,技术的更迭也是日新月异,这次我整理了近3个月的包含谷歌/苹果/亚马逊/阿里等最新大模型研究102篇大模型论文,给大家做学习参考。
扫码回复“大模型”
领最新100+篇大模型论文合集
AI大模型,正在改变世界,为了更好的入局AI大模型,这次我特意复盘和整理大模型学习脉络,开了30节大模型的课程,包含大模型理论、大模型论文带读以及大模型企业项目实战,还附赠500+大模型论文。
0.01元解锁30节“AI大模型系列课程”
领500+篇大模型论文合集
以下是《AI大模型系列课》课程目录
第一课:NLP大模型:基础、前沿与学习路径
第二课:基于模型量化的大模型压缩的进展
🔻 压缩技术中,为什么量化要优于剪枝、蒸馏?
🔻 如何搜索裁剪阈值用于裁剪outlier?
🔻 包含有异常值outlier的特征如何量化?
第三课:基于模型剪枝的大模型高效计算和应用
🔻 模型剪枝的技术背景
🔻 模型剪枝具体方法
🔻 模型剪枝前沿方法
🔻 语言模型剪枝实例
第四课:讲解扩散模型的基础知识及拓展应用
🔻 AI作画--以文生图
🔻 扩散模型是什么
🔻 扩散模型工作拓展
🔻 扩散模型带来的机遇
第五课:大语言模型的RLHF
🔻 RLHF的优点和挑战
🔻 RLHF如何改善大模型性能
🔻 RLHF的实际应用案例
🔻 RLHF在大模型的未来趋势
第六课:[LLM + 微调]大模型的高效微调
🔻 01 介绍
🔻 02 常用的高效微调方法介绍
🔻 03 如何针对领域数据集根据高效微调方法创造大语言模型
🔻 04 未来挑战与研究方向
第七课:大模型医疗
🔻 医疗领域的数据特点、挑战和机遇
🔻 大模型的定义和特点,如预训练、微调、指令学习等
🔻 针对ChatGLM大模型,介绍ChatGLM模型微调
🔻 代码实践以及模型微调
第八课:大模型基本概念以及应用场景
🔻 发展线路与技术手段
🔻 应用场景
🔻 缺点与局限
🔻 未来展望
第九课:LLAMA2中文大模型
🔻 理论介绍
🔻 代码实践
第十课:大模型前沿论文带读训练营(NLP方向)
🔻 01 LLaMA训练营
🔻 02 LLaMA训练营——精读
🔻 03 LLaMA训练营——代码讲解
🔻 04 GLM-130B训练营——论文泛读
🔻 05 GLM-130B训练营——论文精读
🔻 06 GLM-130B训练营——代码讲解
🔻 07 Alpaca训练营——论文泛读
🔻 08 Alpaca训练营——论文精读
🔻 09 Alpaca训练营——代码讲解
第十一课:掌握大模型领域前沿,跑通三套企业级项目代码
🔻 01 开发基于大模型的聊天机器人
🔻 02 实战基于大模型的对话系统(实战一)
🔻 03 大模型模型原理及综述
🔻 04 大语言模型(LLM)原理及综述
🔻 05 精读大模型-3论文、Instruct论文
🔻 06 精读谷歌PaLM论文、脸书LLaMA论文
🔻 07 实战基于大模型的对话系统(实战二)
🔻 08 实战微调LLaMA模型
扫码回复“大模型”
领500+篇大模型论文合集
在大模型的构建之下,AI自动化交互,将会决定世界的未来,谁的大模型更强大,将决定在遥远的未来的话语权,同时,大模型会成为AI基础设施。
2024年也必将是大模型继续活跃的一年,不想错过大模型机遇的同学,赶紧0.01元扫码获取30节《AI大模型系列课程》!
0.01元解锁30节“AI大模型系列课程”
领500+篇大模型论文合集