超1.2万人参加CVPR 2024,谷歌研究院获得最佳论文
大数据文摘
共 8505字,需浏览 18分钟
·
2024-06-20 12:30
早在2月27日,CVPR 官网就公布了今年的论文接收结果:CVPR 2024 共有 35691 位注册作者,11532 篇提交论文,其中 2719 篇被接收,录用率为 23.6%。
CVPR 2024 颁奖环节
https://arxiv.org/pdf/2309.07906
https://imageomics.github.io/bioclip/
图像视频生成占领C位
从近期乔治亚理工学院计算机学院(College of Computing, Georgia Institute of Technology)对 CVPR 2024 录用数据的统计分析来看,论文主要涵盖36个主题领域,排名前十的主题分别是:图像和视频合成与生成,三维视觉,人体行为识别,视觉、语言与语言推理,底层视觉,识别(分类、检测、检索),迁移学习与多模态学习。其中,除了自动驾驶与三维视觉这两位热点常客外,今年排在首位的关键词是图像和视频合成与生成(Image and video synthesis and generation),总计有 329 篇论文,成为了今年 CVPR 最火的研究主题。
视觉基础模型点燃现场
基于 Transformer,以及受到语言大模型的启发,计算机视觉领域在 2023 年以来对视觉基础模型(VFM)的研究热情高涨。
分享嘉宾:Tiktok-Chunyuan Li
写在最后
两天前,Runway 时隔一年推出 Gen-3 Alpha,宣布视频生成赛道王者归来。在 CVPR 2024 的现场,AI 科技评论也听到了关于 GPT-5 或于 3 个月后发布的消息,业内对其推理能力与多模态能力更是报以期待。
评论