MiniGPT-4使用 LLM 增强视觉语言理解认领

0粉丝

MiniGPT-4 可使用高级大型语言模型增强视觉语言理解。MiniGPT-4 仅使用一个投影层将来自 BLIP-2 的冻结视觉编码器与冻结 LLM

简介

MiniGPT-4 可使用高级大型语言模型增强视觉语言理解。MiniGPT-4 仅使用一个投影层将来自 BLIP-2 的冻结视觉编码器与冻结 LLM Vicuna 对齐。MiniGPT-4 的训练分两个阶段：第一个传统预训练阶段使用 4 个 A100 在 10 小时内使用大约 500 万个对齐的图像... 更多

其它信息

地区

不详

开发语言

Python

开源组织

无

所属分类

神经网络/人工智能、计算机视觉库/人脸识别

授权协议

BSD 3-Clause

操作系统

跨平台

收录时间

2023-09-25

软件类型

开源软件

适用人群

未知

时光轴

里程碑1

LOG0

2023

2023-09

轻识收录

打卡

评价

0.0（满分 10 分）0 个评分

什么是点评分

图片

表情

全部评价( 0)

推荐率 100%

推荐

MiniGPT-4使用 LLM 增强视觉语言理解

MiniGPT-4 可使用高级大型语言模型增强视觉语言理解。MiniGPT-4 仅使用一个投影层将来

MiniGPT-4使用 LLM 增强视觉语言理解

MLC LLM本地大语言模型

MLCLLM是一种通用解决方案，它允许将任何语言模型本地部署在各种硬件后端和本地应用程序上。此外，MLCLLM还提供了一个高效的框架，供使用者根据需求进一步优化模型性能。MLCLLM旨在让每个人都能在

MLC LLM本地大语言模型

MLC LLM本地大语言模型

MLC LLM 是一种通用解决方案，它允许将任何语言模型本地部署在各种硬件后端和本地应用程序上。此外

MLC LLM本地大语言模型

Marsha基于 LLM 的编程语言

Marsha 是一种基于 LLM的编程语言。用简单的语法描述你想要完成的任务，提供使用示例，Mars

Marsha基于 LLM 的编程语言

Marsha基于 LLM 的编程语言

Marsha是一种基于LLM的编程语言。用简单的语法描述你想要完成的任务，提供使用示例，Marsha编译器将指导LLM生成经过测试的Python软件。可通过终端或JupyterNotebook使用pi

Marsha基于 LLM 的编程语言

LIDA使用 LLM 自动生成可视化和信息图表

LIDA使用 LLM 自动生成可视化和信息图表

LIDA使用 LLM 自动生成可视化和信息图表

LIDA是一个用于生成数据可视化和忠实于数据的信息图表的库。LIDA与语法无关（可与任何编程语言和可视化库配合使用，例如matplotlib、seaborn、altair、d3等），并可与多个大型语言

LIDA使用 LLM 自动生成可视化和信息图表

通义千问-VL大规模视觉语言模型

通义千问-VL(Qwen-VL)是阿里云研发的大规模视觉语言模型（LargeVisionLanguageModel,LVLM）。Qwen-VL可以以图像、文本、检测框作为输入，并以文本和检测框作为输出

通义千问-VL大规模视觉语言模型

VLE视觉-语言多模态预训练模型

VLE (Vision-Language Encoder) 是一种基于预训练文本和图像编码器的图像-

VLE视觉-语言多模态预训练模型

Web LLM将语言模型聊天直接带到 Web 浏览器上

Web LLM 是一个可将大型语言模型和基于 LLM 的聊天机器人引入 Web 浏览器的项目。一切都

Web LLM将语言模型聊天直接带到 Web 浏览器上