4 个 GitHub 上令人惊艳的项目!

共 2666字,需浏览 6分钟

 ·

2024-05-08 09:19

往期热门文章:


    

1、90 后程序员辞职搞灰产,不到一年获利超 700 万,结局很刑!

2、Redis“叛逃”开源,得罪了几乎所有人

3、潜伏开源项目3年,混成核心开发者,竟然只为加一个后门

4、就因为开发环境用了 Docker,就被开除了

5、有人问我数据库ER图为什么这么好看?

本期推荐开源项目目录:
1. Llama 3 大模型开源了!
2. 知识库问答系统
3. 构建 AI 助手的框架
4. 开源的 RAG 引擎

01

Llama 3 大模型开源了!
Llama 3 是 Meta 发布的最新大型语言模型,旨在让个人、创作者、研究人员和各种规模的企业能够负责任地试验、创新和扩展他们的想法。
相比于之前发布的开源模型, Llama 3 的特性是:
  • 数据量:训练的数据是 Llama 2数据集的 7 倍多
  • 能力增强:推理和代码能力增强
  • 训练效率:比 Llama2 高 3 倍;
  • 模型大小:提供从 8B 到 70B 参数的不同大小的预训练和指令调整的 Llama 3语言模型
  • 下载和使用:提供了模型权重和分词器的下载指南,以及如何在本地运行模型的快速入门步骤
  • 支持模型并行:不同大小的模型需要不同的模型并行(MP)值
  • 许可证: 模型和权重对研究人员和商业实体开放,旨在促进发现和道德的AI进步
开源地址:https://github.com/meta-llama/llama3

02

知识库问答系统
MaxKB 是一个基于大型语言模型(LLM)的知识库问答系统,旨在成为企业的“最强大脑”,由开发者  1Panel-dev 开源,目前已经获得了 2.9k 的 Star。这个是该开源项目的特性:
  • 开箱即用:支持上传文档和自动爬取在线文档,文本自动拆分和向量化,提供良好的智能问答交互体验。
  • 无缝嵌入:可以快速嵌入到第三方业务系统中,无需编码。
  • 多模型支持:支持多种主流的大型模型,包括本地私有模型和云服务模型。
开源地址:https://github.com/1Panel-dev/MaxKB

03

构建 AI 助手的框架
Phidata 是一个用于构建具有记忆、知识和工具的AI助手的框架,用来解决大型语言模型(LLM)上下文限制和无法执行操作的问题。他的工作原理如下:
  • 记忆:通过数据库存储聊天历史,使LLM能够进行长期对话。
  • 知识:通过向量数据库存储信息,为LLM提供上下文。
  • 工具:使LLM能够执行如从API提取数据、发送电子邮件或查询数据库等操作。
开源地址:https://github.com/phidatahq/phidata

04

开源的 RAG 引擎
RAGFlow 是由开发者 infiniflow 开源,目前已经获得了 5.2K 的 Star。该项目是一个开源的 RAG(Retrieval-Augmented Generation,检索增强生成)引擎,基于深度文档理解,为不同规模的企业提供简化的 RAG 工作流程。
它由如下关键特性:
  • 高质量输入输出: 从复杂格式的非结构化数据中进行深度文档理解并提取知识。
  • 模板化分块: 提供智能且可解释的模板选项。
  • 基于引用的引用: 减少幻觉,通过可视化的文本分块允许人工干预,快速查看关键引用和可追溯的引用来支持基于事实的答案。
  • 异构数据源兼容性: 支持 Word、PPT、Excel、TXT、图像、扫描副本、结构化数据、网页等。
  • 自动化 RAG 工作流: 提供为个人和大型企业量身定制的简化 RAG 编排,包括可配置的 LLM 和嵌入模型,多重召回与融合重排,以及与业务无缝集成的直观 API。
开源地址:https://github.com/infiniflow/ragflow
    

往期热门文章:

1我用这10招,能减少了80%的BUG
2、突发!特斯拉大量毁约应届生offer…
3、警报炸锅了,FastJson 又立功了。。
4、一个小公司的技术开发心酸事(已倒闭)
5、JetBrains 如何看待自己的软件在中国被频繁破解?
6、程序员因Bug被要求归还4万多年终奖,网友:不还!
7、一套万能通用的异步处理方案
8、微服务全做错了!谷歌提出新方法,成本直接降9倍!
9、IntelliJ IDEA 2024 首个大版本发布,好用到爆!
10、Web 后端的一生之敌:分页器


浏览 310
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报