博士生在没有导师指导的情况下,该如何自己选题发 CVPR ?

极市平台

共 8358字,需浏览 17分钟

 ·

2021-07-27 15:50

↑ 点击蓝字 关注极市平台

来源丨知乎
编辑丨极市平台
本文仅作为学术分享,侵删

极市导读

 

本文就"博士生没有导师指导,如何自己发CVPR?" 一问题撷英掇华,精选了高赞回答希望对大家有所助益。>>加入极市CV技术交流群,走在计算机视觉的最前沿

知乎原址:https://www.zhihu.com/question/64566768
读博难不难?作为最高学历,顺利毕业难是不争的事实。科研大水泱泱,水王目不暇接,卷王横行于世,发论文这条路上向来摩肩接踵。
这条路走的顺的只是少数,大多数读博生面临没有大神带飞,选题屡被否定,数年没成果等困境。网络上屡有人问诸如“博士N年级了,没导师带,想尝试自己发CVPR,这有可能嘛?”
这里分享一下知乎上几位大佬的回答,希望对需要的人有所帮助!

# 回答一

作者:付聪Ben

浙江大学计算机博士,美国南加州大学访问学者。阿里巴巴算法专家。

来源链接:

https://www.zhihu.com/question/64566768/answer/284168257

1.看论文选题

看论文不是盲目的看,选题必须是大势所趋的方向。可以通过各种渠道了解当年大热。比如在arxiv上订阅一些主题,跟踪一些大牛组。有些东西都是没投之前,在arxiv、微博、微信公众号上已经火了一把了,等投稿接收之前就已经有一群人follow了,follow的工作甚至可以和原文同时命中。

2.学习思考模式(灌水模式)

看论文的时候,大部分论文不具备可以follow的insight。也就是水文。那么,看水文就要看写作,看水的方式,这是最简单的出文方式。这里,我可以直接列举一下思路。
a、A+B+C模式。 有人在优化领域做了个A,但是并不完美,另外有人在某些领域做了个B,可以配合A解决某问题。那么,你看出来了,于是你试试看A+B,work。好了。想办法编个故事。把A不能解决的问题说得十分紧要,体现你的novelty。
b、比赛模式。 在公开数据集的比赛项目上不断尝试想法。做到第一的足够发论文,第二第三的有新奇想法和insight也可以发文。这种模式结果可信,因此不会有人喷结果,一般就是要想办法讲一个很美的故事,把你的所有哪怕最小的trick的价值都体现的淋漓尽致。
c、挖坟模式。 cv领域有很多传统问题,很多人还在锲而不舍的用老方法提升。但是现在其他会议出来很多新工具,想办法加进去,实现相同目标但更高性能。
d、挖坑模式。 从实际需求出发,想一个新问题。这种方式不用着急做实验,但是一定要故事讲很好,所以难度很高。不然reviewers won't buy it。李飞飞就是挖坑起家,少有人能模仿那么好的。

3.学习写作能力

这个其实甚至和第一点一样重要,但很模糊。
如果你结果solid到无处可喷,写作差一点不太碍事。但大多数文章都是靠写作取胜的,实际效果都不一定能还原。
这没有捷径,就要写和学。尽快尝试投稿,投过一次就知道top conference的level在哪,写作的问题在哪。
比如,哪些东西是你明明写了,但reviewer却还在问。那就说明人家认为那是重点你却没写清楚。你就要调整文章结构,把人家觉得重要的东西在醒目位置尽早写清楚。
始终记住,没有人有超过二十分钟的时间去读懂你的文章,看了introduction都没觉得你做的东西有趣的时候就没戏了。
最重要的是不要写Chinese English。多看看外国报纸,美国人的论文。

4.培植个人科研组群

如果你实验室师兄都没什么墨水,实验室也没有积累,导师更水。再加上跨实验室去找别人合作涉及人情关系,导师关系,论文归属之类,更加头疼。就不存在高票答案说的可以有合作伙伴实力加盟。
那么,你需要培植自己的势力。
找高年级博士是不可取的,他们肯定希望做出成果归自己,缓解毕业压力。
安全的方式,是找二年级及以下的师兄,甚至过年后找学弟,而且要认真筛选,别找准备抱大腿不干活的。
我自己做ANN的时候甚至出过试题,考察学弟的学习和coding能力。所以,跟我合作的学弟们都在我经手的论文里发挥了重要作用,配得上二三作的位置。
有人加入就要明确规矩,如何按contribution排位置,不要讲人情。

5.进入实际业务领域实习

放假就去cv公司实习,你会发现有太多太多有趣的问题可做了。

# 回答二

作者:匿名用户

来源链接:

https://www.zhihu.com/question/64566768/answer/707903663
在我国外读博士的时候,就有这个问题——自己怎么发顶会。那个时候我的导师放羊,并且我的项目都是与机器学习无关的。导师几近退休,所以他其实也根本不在乎我发不发文章,发什么文章。虽然我自己想尽办法在几次实习期间,都做了点东西,也写了文章,但是很遗憾,最后也都是只中了诸如bmvc,wacv之类的二流。
一直等我到某牛手底下做博后的时候,才再次有了机会。虽然还是被放养,一个礼拜也不见的能见到某牛一面,但是某牛的确有高屋建瓴的指导 ---- 尤其是在如何讲好一个故事上。我也才开始渐入佳境,渐渐每年总能中个一两篇。
如今我自己做了老师,不同的身份和经历,同一个问题也让我有了不同的看待。

1.必须要说明的事情是,发CVPR这个事情,或者概言之发顶会这个事情的基本常识:

  • 然存在运气成分,但是运气只给那些已经有准备的人。不要以为只要你投了,就有30%的概率中。大量的文章,在reviewer眼中几乎可以一眼就拒绝掉。这样的文章,不管你投多少次,结局是早已注定的。

  • 发顶会,必然是需要个人努力的。但是你必须要做好长期努力的准备。换句话说,一两年内没效果也没有什么好奇怪的。你努力了,别指望一定就有产出;但是你不努力,必然颗粒无收。

  • 顶会也只能是敲门砖,更重要是的是你的个人能力。好好实习,编程牛逼,硬件无敌,有一技之长一样可以进好单位。

2.在我眼里发顶会的必要条件或最低要求

  • 语言要过关:如果你英文不好,说半天说不清楚,肯定是不行的。语法,行文,这些都可以说必不可少的。没人会接受一篇,根本读不懂的文章。也不会有人愿意一篇到处错别字的文章。六级不过,那就注定只能是别人帮你写文章,你挂名。另外科学写作和其他的英语行文也不一样,即便你过了六级,也不见得就达标了。

  • 故事要合理:具体怎么讲故事,因人而异,就跟拍电影一样,每个人都可以不一样。但是,你不能在自己的故事里面有明显的瑕疵。比如前面埋了坑,承诺了某项优点,后面结果中却缺失。比如故事的逻辑推断不符合常理。……总之,你最起码要能自圆其说。

  • 结果要过关:不管怎么绕,你没有可能在顶会上发表一篇明显比SoTA更差的文章。注意这里所谓的结果是个抽象概念,而不是具体的指标。如果别人准确率比你高,你可以跟人比速度,如果比人速度比你快,你可以跟他比消耗资源……总之,你要有一技之长,给你的方法定位准确的目标客户群。

  • 话题要贴切:不是做图像的,都应该发CVPR。如果在投稿的时候,你发现很难找到对应的track。那就说明了,你其实并不合适投这个会。比如混沌图像加密之类的话题就不合适。

  • 长的要好看:我犹豫再三,还是把此点列入。虽然reviewer不应该以貌取人,但是事实就是如此,长的不好看的文章,天生就被人歧视,又或者说,一眼就揭示出了投稿人的经验缺失,从而悲剧。在CV领域,画图做表的功夫尤为重要。怎么才是好的,这个没有固定答案,但是最起码,你要保证所有图表的一贯性,大小,字号,清晰度,长宽比,用色等等。当然如果你还在用word写文章,那就当我什么都没有说好了。

上述大概就是文章的最低要求,重要程度不分先后。但是还有一些其他的先决条件,也必须要考虑在内:
  • 要有足够的计算资源:注意这并不是一个绝对标准,而是一个相对的。比如,你就一块GPU,那你还是别做imagenet这样的物体分类任务了,因为你烧不起。但是,如果你做降噪的任务,那一块好的GPU省省也够了。如果你只有CPU,那做传统算法也不见得就没有出路。总之要量力而行。

  • 要有足够的编程基础:至少需要熟练使用python,基本的图像处理库,如opencv,skimage之流,机器学习sklearn之流,另外加一门常见的深度学习框架。如果连基本的编程都不会,类是啥都不知道,那么还是先补全了吧。

  • 要有足够的理论基础:不管是数学还是机器学习,你至少得要知道,你在干什么。指望把别人现成的代码,改改就发顶会的,并不是不能做到。但是前提是,你得要真的知道每行代码在干什么。因为,不管逻辑上多不合理的模型,只要python不报错,你就能训练。所以,你必须要靠自己才能确认代码的确执行了,你想要的算法,达到了你的预期,而非完全不管不顾当个黑盒子。很多人跟风说DL炼丹,虽然我不否认有黑魔法的部分,但是其中也有不少老手一眼就能看出会导致练不出丹错误。

  • 要有足够的时间:通常来说,从无到有,一篇顶会,基本需要3-9月的全职劳动。时间上的差别因人因任务而异。如果你没那么多时间的投入,那没啥好说的,洗洗睡吧。

  • 要有足够的执行力:这其实和时间也很相关,但是经常被忽视。如果你指望在发顶会这件事情上,勤能补拙,不是说不可以,而是说,勤快并不能帮你太多——因为如果你不能在9个月中勤快发出第一稿去,那么几乎可以说,你再好的idea也可能变的没那么好了。因为9个月足够其他人把之前的SoTA推进一截了。这意味着,你要重新做实验,做比较。

  • 要有足够的铺垫: 这点至少我认为是非常重要的。虽然不可否认,有学生第一次投顶会就中了,但是很负责的说,在其上我所花的精力是那些有过准备学生的3-4倍。从现实的角度出发,没人打游戏上来就干boss的,你总要打野升级,有点经验才行。

如果你能达到上面的基本要求,那么恭喜你,我觉得你有投顶会的前提。不然的话,还是应该考虑迅速弥补自己短板。
提供一个准确的外在评估方式,你自己投一次顶会看看(从strong accept+2分,到strong reject-2分,总共5档),如果你所有reviewer的总分到了-1分高,那才说明你有了被幸运女神眷恋的资本——30%的运气,现在可以用到你身上了。
有鉴于此,说句得罪人的话,如果你不觉得自己是学生中的异类,反而觉得自己是大多数的话,那我劝你还是别折腾了,因为不管cvpr今年的录取数量是不是又创了新高,“顶会”两个字就注定了它不可能是大多数人能中的。
其实在我眼中以上的先决条件,才是阻止大多数学生发顶会的更大的绊脚石。
可事实却是很多时候,人的劣根性总是会让我们把理由找到别人身上——没有导师指导。至少之前的我就是这么觉得的。可如今想来,全国能发顶会顶刊的,为什么都集中在某些学校和实验室?因为导师指导么?当然不是全部!学生本身是更大的原因——当我把同一个idea交给两个不同的学生去做的时候,有人一个礼拜就能出结果,有人却一个学期也做不出来。大多数导师,根本没有那么多时间给你指导,有指导也多是在大方向上的,指望老师给你看看tensorboard还行,但是要给你看代码,那你确实是想多了。

3.终于要说到选题了——这反而是我并不太看重的部分。至少和能不能发没太大的关系。

原因很简单,每口井下都有金子,关键看你能不能掘出来。
诸如传统的模版匹配都能发cvpr,有什么课题是一定不能的?可以说,大多数情况下,你并不能特别取巧的选题。老课题做的人多,需要比较的方法就多,但是反过来,数据,评价标准,等等,都有了固定套路。
模仿其实很容易,只要结果比SoTA好的多,八股文中的也不是少数。新课题做的人少,但是新课题可不是一拍脑袋想出来就完了的,实验数据呢?没配套的数据,新问题根本无法入手。千万别想着自己标,这事情在深度学习来了之后,就已经越来越不现实了。半老不新的,已经有数据的问题,其实也有。但是这样的冷门,对于一般人来说正是因为他的冷门,即便你见到了也不认识。
我个人建议,选个自己有兴趣的课题做就好了——至少能保证你努力的过程中不那么痛苦。

4.最后谈谈发文章本身

回顾个人经历,从博士一直到前两年,快十年时间内,我几乎都是一个人在干活 —— 一般老板都会给一个大的课题,可是具体做什么方向,用什么方法,怎么做,写什么文章,怎么写,基本都是我自己看着办。老板最大的帮助是给了我一个单位,一份不啃老的薪水,还有大概一个礼拜能分到的15-30分钟。所以我基本的工作状态没有太大的变化。但是为什么后面就能中了,而前面,我就只是在当分母?
这里面当然有熟能生巧的因素。但是仔细想想,其实我至少在博四的时候,就已然有了很好的条件——我发过了几篇还行的会议和期刊,已然完成了原始积累。而实习的项目,其实也给了我很好的数据,和实验平台。并且我干劲十足,想要顶会。但是我的所有尝试,却也一直都在失败中度过。我也一直都不知道原因,总是以运气不好,或者没人罩着难出头,来宽慰自己。
一直到博后期间,我才真正意识到自己的问题 —— 我其实根本不会做研究。我之前所做的,更多的都是在做项目。哪怕有自己的思考,缺不懂得恰当的展现,以至于最后做出来的东西,却也跟一个报告没多大差别了——为啥做这个,具体做了啥,性能多少分。大概就是这样,明显的八股文,干涩难啃,压根也没有想过要讲一个好故事。
举例来说,一个我自认为没啥特别的实验结果,虽然搞了不少自觉可行的改进,但是性能其实和SoTA没多大改进。可这个结果,某牛居然告诉我,这能发cvpr。虽然当时我承认按照他说的思路写,文章的确变的有趣了些,但是我却也没有报什么希望。果然那一年我还是没有中。但是某牛告诉我,那是我们运气不太好,让我改下格式再投pami。然后就是很神奇得到了好评,大家都觉得这个故事虽然结局一般,但是过程很好看,几乎没太改就发了。
直到那时,我才认可了某牛的说法,意识到了自己的浅薄——这么多年书都读狗身上了,跟个痴汉一样就知道硬来,凡事只想用高性能直接把审稿人干趴下,却根本不晓得要去引导/迎合审稿人的口味。
等自己中了更多,也审了别人更多之后。才真正明白,其实能让人眼前一亮的,并不是只有好的性能,好的故事一样也可以。而实际中,好故事远比好性能要容易做到的多。
虽然单枪匹马的确是更加难,但是还是真诚说一声,”天道酬勤,祝君好运“

# 回答三

作者:匿名用户

来源链接:

https://www.zhihu.com/question/64566768/answer/283971272
曾经待的实验室和题主说的情况很类似,不过从“选题完全自己定”可以看出你们research还是挺自由的。一个放羊的老板,不给项目压力,不让做乱七八糟的杂活,可能很多人不愿相信,但我(包括身边很多人)觉得这是国内导师顶峰了。能够给指导的实验室,可遇不可求;整日让干杂活,压榨学生,不学无术的导师国内大有人在(包括T大P大)。
只要有时间人身自由,大可以出去实习交流,接触更好的环境。没卡没机器,没有高水平的同学交流,这些因素看起来很致命,但可以在外面找到;如果没有这种自由,早日quit及时止损为上策。读博不是为了混个title,闭门造车,苟且地讨好老板。假设熬个几年混个学位出来,没有一点前沿的高质量工作,也不过是个土博罢了。

# 回答四

作者:武伟

来源链接:

https://www.zhihu.com/question/64566768/answer/284352462
  1. 找公开课入门
  2. 花血本买两块1080显卡做实验(这是2017年的回答,现在应该得RTX 20系或者30系显卡了)
  3. 找一个方向深入了解,复现SOA的工作
  4. 把SOA的工作应用到某个垂直领域并找到一份实习,卖掉自己的显卡用公司集群做实验
  5. 了解更多方向建立比较完备的知识体系
  6. 在实习的公司transfer到一个比较强的组
  7. 开始在某些SOA的工作上做自己的改进
  8. fail,debug,fail,debug...某一天突然work
  9. 写一篇paper并邀请有经验的同事peer review
  10. good luckPS:我组里招收有潜力的实习生,有意欢迎私信哈


# 回答五

作者:Xf Mao

来源链接:

https://www.zhihu.com/question/64566768/answer/221841077
谢邀,首先看了一下你的情况,和我很类似,实验室环境很自由,导师没有逼你做项目,也没有要求具体的研究方向,属于散养。就我的经验,顶刊作者们都会有一些共同的品质:

1.极其规律的作息

如果你连这个都做不到,就歇了吧...我不知道其他专业是什么情况,就cs领域看,学术能力和智商天赋是不挂钩的,唯一挂钩的只有你付出的汗水和努力。
就初期选题和调研这一阶段,每天都要求一定的paper阅读量,如果你真的看好了CVPR,就把cvpr12-17全部刷一遍,刷完保证你有新体会(其实你会发现CVPR特别爱收某一类的文章,不多说...)
另外选题很重要,可能会影响你以后的各个阶段的开展难度,当你确定了研究方向,接下来就只要阅读这个领域的文章了,此时就不限于CVPR这个会,可以看其他会议或者期刊的相关文章,找找idea。

2.勇敢尝试,勇于挑战

很重要的品质,idea需要落地,那就要不断地实验,某些实验确实很难,这就需要你有足够的信心和勇气去实现它。肯定会有某些CVPR会议论文的一作,是由合作伙伴或者学生来帮他们完成实验的,那就相对轻松点。但是你不行,你只有一个人,所以什么都要靠自己动手做不要一说到CVPR,ICCV,IJCV就开始害怕并且怀疑自己。
既然你的要求只是发CVPR会议论文,而不是oral或者拿一些reward之类的,那难度都可以接受,每年CVPR也有很多水文,主要还是学一个套路(另外不要忘了做实验的时候也要保持关注该领域最新的研究进展)

3.受虐狂

这个不用多说吧,好的论文都是在拍脑门-尝试-失败-再拍-再尝试-再失败,这个循环中过来的,随时做好失败的准备,然后重新开始但是对于某些问题不要过分的钻牛角尖,这个平衡要自己来把握

4.活在自己的世界中

我觉得,对于题主的情况,这一点是最核心的,我们总是会被周围环境影响,在一个散漫的氛围里,很容易堕落,既然题主想做实验室的一股清流,那就要出淤泥而不染,每时每刻都做好自我监督。保证这一点,以上三点才有发挥的余地当你投入其中一段时间,就会发现学术的乐趣,此时再没必要“自我监督”,而是真的用热情去做,这种“活在自己世界”的状态,是最容易出成果的
综上,做好以上四点,保证你一定能发CVPR(CVPR的poster真的不难,这是真的。)哦对了,总结一下就是:做大牛很难,但是灌水就另说了。

如果觉得有用,就请分享到朋友圈吧!

△点击卡片关注极市平台,获取最新CV干货

公众号后台回复“ICCV2021”获取最新论文合集


极市干货
YOLO教程:一文读懂YOLO V5 与 YOLO V4大盘点|YOLO 系目标检测算法总览全面解析YOLO V4网络结构
实操教程:PyTorch vs LibTorch:网络推理速度谁更快?只用两行代码,我让Transformer推理加速了50倍PyTorch AutoGrad C++层实现
算法技巧(trick):深度学习训练tricks总结(有实验支撑)深度强化学习调参Tricks合集长尾识别中的Tricks汇总(AAAI2021
最新CV竞赛:2021 高通人工智能应用创新大赛CVPR 2021 | Short-video Face Parsing Challenge3D人体目标检测与行为分析竞赛开赛,奖池7万+,数据集达16671张!


CV技术社群邀请函 #

△长按添加极市小助手
添加极市小助手微信(ID : cvmart4)

备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)


即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群


每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~



觉得有用麻烦给个在看啦~  


浏览 22
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报