贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合!读懂梗图刷爆榜单,代码复现数学函数
AI算法与图像处理
共 4555字,需浏览 10分钟
·
2024-04-16 17:05
【导读】贾佳亚团队提出VLM模型Mini-Gemini,堪比GPT-4+DALL-E 3王炸组合,一上线就刷爆了多模态任务榜单!读得懂梗图,做得了学术,用代码就能复现数学函数图。
Demo地址: http://103.170.5.190:7860/
图片理解天花板
推理再生成,更精准了
超会玩梗
技术细节
如上演示中,Mini-Gemini是怎样做到这种惊艳的效果呢?
而其中的核心在于三点:
(1)用于高清图像的双编码器机制;
(2)更高质量的数据;
媲美Gemini Pro和GPT-4V
人人在线可玩
评论