顶会Best Paper一作:所有实习经历都是有意义的

极市平台

共 5252字,需浏览 11分钟

 ·

2020-11-21 15:48

↑ 点击蓝字 关注极市平台

来源丨微软亚洲研究院
编辑丨极市平台

极市导读

 

三位不同时期在微软亚洲研究院实习的实习生,作为第一作者斩获了各自领域重量级论文奖项,他们在微软亚洲研究院有着怎样的经历和体会,他们为什么能突破科研的重围,未来想进入微软亚洲研究院实习的同学们,这篇分享绝对不可错过。 >>加入极市CV技术交流群,走在计算机视觉的最前沿

2020年即将落下帷幕,回首这一年,相信很多人都通过努力离自己的目标更近了一步。同样,微软亚洲研究院三位不同阶段的“实习生”也在这特殊的一年结束之际,斩获了自己学术生涯的新奖项,给2020年添上了喜人的一笔。他们中有不愿意被“神话”的康奈尔在读博士生,有视科研如日常的邻家女孩,还有已“独木成林”、致力于 AI 落地的公司高管。

三个人的共通之处在于,此次获奖的论文都是他们在微软亚洲研究院实习期间的科研成果。那么,微软亚洲研究院这个“助攻”到底给予了他们什么样的支持?让我们走进三位实习生的世界,卸去 Best Paper 光环后,重新审视他们脚踏实地的实习经历。

张云昊:我不是"大神",我就是个普通人

2019年是张云昊在康奈尔大学攻读博士的第二年,在博导 Lorenzo Alvisi 的建议下,他利用暑假时间在微软亚洲研究院进行了三个月的实习。实习期间,张云昊与导师周礼栋(微软亚洲研究院常务副院长)、陈琪(微软亚洲研究院主管研究员)共同确立了一个研究课题,并在回到学校之后,继续远程合作研究了一年多,最终发表了论文“Byzantine Ordered Consensus without Byzantine Oligarchy(拜占庭有序共识中的寡头统治与民主)”。今年,在被誉为“操作系统原理领域奥斯卡”的 OSDI 2020 大会上,该论文荣获了 “Best Paper Award”(最佳论文奖)。

这篇文章拓展了分布式系统中共识问题的经典定义,并给出了新定义下的第一个系统设计与实现。在传统的共识问题中,所有正确节点需要达成一致的执行顺序,而具体达成什么样的顺序并不重要。但是在依赖共识的许可区块链中,节点的利益与该顺序紧密相关。例如,在应用于交易的许可链中,不同节点提交的购买请求的执行顺序决定了哪些节点能够最终交易成功。因此,该文章提出了“有序共识”的概念,通过引入顺序正确性维度扩充了共识问题的定义。

张云昊在微软亚洲研究院实习期间的工位

在张云昊看来,科研工作可以大致分为两种:定义问题和解决问题。很多博士生会选择寻找创新的方式来解决已有问题,因为难度相对可控。所以当要拓展共识问题的经典定义时,张云昊有些犹豫。然而,在两位导师的鼓励和耐心指导下,张云昊发现了曾获得1972年诺贝尔经济学奖的社会选择理论,大家一致认定该理论和分布式系统的共识十分相关。经过数个月的共同探索,大家终于从社会选择理论中获得灵感,并结合两位导师一直在研究的新共识协议,在疫情期间潜心合作完成了这份研究工作。

好的系统研究应该理论和实践并重。在实践方面,微软亚洲研究院提供的资源让张云昊印象最为深刻,“当时系统需要跑在100台机器上,横跨三个数据中心。我很庆幸是在微软亚洲研究院做这个项目,因为这样的软硬件支持是一般大学和学术机构难以提供的。”

虽然在研究院只有短短的三个月时间,但这里多元包容的文化,也给了张云昊很大的启发。那时候坐在张云昊旁边的是来自清华美院的黄杰妮同学,这让他十分意外。闲暇时间他们聊了很多 UI 色彩搭配、UX 用户体验、国内外设计师差异、服装染织工艺等等计算机领域以外的有意思的话题。实习的三个月里,除了与导师的密切沟通,与不同研究组、不同背景的实习生小伙伴间的交流也让张云昊收获颇多。

张云昊在科研毫无进展时到芝加哥旅游散心

获得最佳论文奖后,张云昊收到了不少同学、朋友的祝贺,以及网络上素不相识的同学们的祝福,但对于大家给他的新称呼“大神”、“大牛”,他有些不适。以南开老校长张伯苓、数学家陈省身为前行榜样的他,一直觉得保持清醒和谦逊尤为重要。他认为自己只是一个普通人,还是个“很想变文艺但一直失败”的工科生,也常常纠结自己作息不规律、效率不够高等问题。“我想对大家说,其实并不一定非得是一个各方面都完美的人才能拿到 Best Paper,只要努力就都有机会。

在张云昊看来,这篇 Best Paper 只是他研究生涯的开始,至于对未来的研究方向有多大影响,他坦言自己并没有想太多,至少未来一两年仍然会在这个方向上继续钻研,再往后,也许会有全新的课题出现,一切都未确定,都是未知。他表示,“做研究很重要的一点,也许就是享受这种不确定性。”

王程一:爱写“日记”,科研这件事已平凡到融入日常

王程一与微软亚洲研究院结缘是在2017年,那时在南开大学读大三的她正在考虑未来的方向,恰好碰上微软亚洲研究院副院长周明老师在学校的演讲,她深受启发打消了出国的想法。在本科毕业之后,王程一申请到了南开大学-微软亚洲研究院联合培养博士生,并在微软亚洲研究院自然语言计算组实习至今。在 InterSpeech 2020 的论文评选中,王程一的论文 “Low Latency End-to-End Streaming Speech Recognition with a Scout Network(基于哨兵网络的低延迟流式端到端语音识别系统)”在千余篇论文中脱颖而出,获得了 “The Best Student Paper Nomination“(最佳学生论文提名)。

该论文研究的是实时语音识别任务,传统的语音识别模型大多数只考虑准确率,但在与微软总部语音产品组的合作中,王程一和团队意识到实时的语音识别产品必须考虑时延,否则如果时延过长,即使准确率高,也会严重影响用户体验。而在业界,即便是考虑到了时延的算法,通常也就是将时延控制在一个固定时长,比如 600ms 或 900ms,由于每个人的语速不同,对于语速很慢的人,这样的限制会导致识别不准确。因此,王程一和研究团队在端到端的语音识别中加入了哨兵网络,能够自主判断一个词是否已结束,等结束之后再开始识别,从而让时延变得动态,可以更好地平衡识别准确率和时延,让实时语音识别模型得以显著提升。

在微软亚洲研究院实习的这段时间里,王程一最大的体会是一定要积极主动地跟导师多沟通,这样才能更快、更深入地了解研究,获得自己想要的成长。她与两位研究员 Mentor 刘树杰和吴俣的沟通频率基本是每天开例会,无论是学术问题还是生活困惑,她都很感激导师们的言无不尽。

王程一(右四)与 Mentor 刘树杰(右二)及组内同事

除了导师,“能够与微软的产品部门合作,是在微软亚洲研究院做研究的另一大优势。产品研发过程中遇到的一些问题,刚好成为研究人员需要攻克的课题,产品与研究的相互促进,让我受益匪浅”,王程一表示,“因为找到了好问题,研究就成功了一半。”而且微软亚洲研究院在软硬件以及数据层面的支持,让语音识别研究在这里更有条件加速开花结果。

王程一有一套自己的学习方法,“每天做完实验会用 OneNote 写日记,没有特别固定的模板,因为平时做的实验大部分都是失败的,如果不记下来,之后可能就会忘掉,再重复工作很浪费时间。平时看 Paper 的时候,我也会下意识地记录下将来可能会用到的信息,方便将来查找。”积累,就在这样的不经意中完成了。

王程一(前排左一)与研究院实习生合影

不骄躁、有一份平常心,但在某些问题上有着自己的坚持,是外人眼中的王程一。或许对于科研工作者来说,“轰轰烈烈”的成就感本就是一瞬间,更多的时候,科研已经是融入日常再普通不过的一件事。

袁晶:研究院的每一段经历和每个人,都让我之后的工作受益

在三位“实习生”中,袁晶最为特殊。他十年前在微软亚洲研究院实习时撰写的论文 “T-Drive: Driving Directions Based on Taxi Trajectories(基于出租车轨迹的行车路线)”,近日获得了 ACM SIGSPATIAL 2020颁发的“10-Year Impact Award Honorable Mention”(10年影响力论文荣誉提名奖)。其实,该论文当年就获得了 ACM SIGSPATIAL 2010大会的 Best Paper Runner-up 奖,十年后,这篇论文产生的影响力持续扩大,因此获得了这个久经时间考验的奖项。

从2009年开始,袁晶在微软亚洲研究院访问实习,时空数据分析、城市计算是他最初的研究方向。那时智能手机的功能还很初步,更没有时下选择众多的打车软件,但袁晶和研究团队敏锐地注意到移动大数据所蕴藏的巨大价值,在那个时间点,选择的研究方向为未来的研究打下了坚实基础。这篇获奖论文就是围绕出租车司机脑海中的智能展开的。通过分析出租车的 GPS 信息,去挖掘司机们在路线规划上的洞察,并且将出租车司机的洞察与路网映射相结合,从而产生最佳的路线推荐。袁晶特别提到,当年他与其他实习生小伙伴一起,亲自上路基于不同的路径推荐算法实地验证路线,这些经历令他至今都印象深刻。

袁晶(右一)与实习时的导师微软亚洲研究院首席研究员谢幸(中)

如今,这篇论文已有近1000次的引用,其中包括多位 ACM/IEEE Fellow 和中国科学院院士团队,对智慧城市等领域的研究做出了很大贡献。而十年前该项目所采用的方法,和今天业界广泛关注的“知识驱动+数据驱动”的“第三代人工智能”十分契合。此后,袁晶正式加入微软亚洲研究院成为研究员,在 LBS、自然语言处理、推荐系统等方面进行研究,也多次获得了包括 KDD/ICDM 等顶会的最佳论文奖项。对于这些研究,袁晶总结,本质上都是研究人类在物理世界和数字世界的轨迹和行为。

后来袁晶加入了微软(亚洲)互联网工程院,带领团队做自然语言处理和相关 AI 技术的产品化。现在,他担任华为云人工智能领域副总裁从事 AI 的商业化应用。尽管袁晶现在的工作看起来离基础研究有些距离,但在微软亚洲研究院做科研的经历他非常珍惜。袁晶表示,基础研究让他拥有对整个 AI 生态最底层、最本质的理解,对研究趋势也非常敏感,这样的积累让他能够更好地把握 AI 产品的价值点,以及 AI 商业落地的规律。

“在微软亚洲研究院,我逐渐找到了做研究的正确方法。研究院本身的氛围和环境就已经能够让你快速成长了,加上各个领域的知名学者经常来做报告分享,可以进一步帮助你形成和提升研究品位。当然自己勤奋阅读论文、了解业内趋势也必不可少。”如今回想起在微软亚洲研究院的时光,袁晶仍记忆犹新,“平时要多和研究院的同事、实习生沟通交流,包括导师以及导师之外的其他研究员、外面来做分享的嘉宾。自己几个礼拜都想不明白的问题,也许只跟他们交流几分钟就能让你豁然开朗,千万不要怕问错问题。”

袁晶(前排右一)实习期间向比尔•盖茨介绍 T-Drive 项目

他还强调,同期实习的同学们也不要忘了建立联系,大家不仅在实习期间可以互相碰撞出研究的火花,多年之后,伙伴们又都成长为了领域内的栋梁和担当,可以携手共进。

结合自己的成长经历,袁晶很看重研究、技术、产品和商业的综合能力。他认为,“对于实习生来说,哪个方向值得做?如何选择课题?怎么评价研究成果?不必单纯着眼于技术本身,可以基于更综合的理念去思考技术在整个生态链中的价值。确定好方向后,也不必着急。只要是你感兴趣的,热情大胆地投入就好,任何经历都会是有意义的。”

现在,张云昊在康奈尔大学继续着自己的求学生活,王程一在微软亚洲研究院专注于自然语言处理的研究,袁晶则继续在人工智能的商业领域开疆拓土。三个有着不同人生轨迹的“科研打工人”,在这样特殊的一年收获了学术界的高度认可,而走下领奖台后,还将有更多艰深的问题等待他们给出答案。


推荐阅读




    添加极市小助手微信(ID : cvmart2),备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳),即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群:月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

    △长按添加极市小助手

    △长按关注极市平台,获取最新CV干货

    觉得有用麻烦给个在看啦~  
    浏览 142
    点赞
    评论
    收藏
    分享

    手机扫一扫分享

    分享
    举报
    评论
    图片
    表情
    推荐
    点赞
    评论
    收藏
    分享

    手机扫一扫分享

    分享
    举报