清华 CVer 对自监督学习的一些思考(文末福利)
点击上方“Jack Cui”,选择“设为星标”
第一时间关注技术干货!
大家好,我是 Jack 。
众所周知,机器学习大致可分为有监督学习和无监督学习。
自监督学习作为无监督学习的一个特例,可以理解它是一种没有人工标注标签的监督学习,即没有人类参与的监督学习。
但标签仍然存在,只不过标签是从输入数据中生成的,通常是使用启发式算法生成。
自监督学习的流行是势在必然的。
在各种主流有监督学习任务都做到很成熟之后,数据成了最重要的瓶颈。
从无标注数据中学习有效信息一直是一个很重要的研究课题,其中自监督学习提供了非常丰富的想象空间。
今天为大家带来的是一位本科清华,博士港中文毕业的大佬,对于自监督学习的一些思考。
1
2
图片具有空间连贯性,视频具有时空连贯性。那么就可以利用这些特点来设计自监督任务。如下图,Solving Jigsaw Puzzles [4] 利用图片中物体空间上的语义连贯性,Temporal order verification [5]任务利用了视频中物体运动的时间连贯性。
图五,利用数据空间、时间连贯性的自监督任务
3
4
我们的世界是在严格的物理学、化学、生物学规则下运行的,视觉信号是这些内在规则的外在反映,而深度学习,正好非常擅长处理高维的视觉信号。
所以,无监督、自监督学习的存在和发展是必然的,因为世界本身就是有序的、低熵的,这使得数据本身就已经包含了丰富的信息。
自监督学习看似神奇,但理解了其本质之后,也就会觉得是情理之中了。当然,目前学术界对自监督学习的理解程度,可能也只是九牛一毛而已。未来会走向什么方向,谁也说不准。
目前是基于数据之间的结构的instance discrimination处于state-of-the-art,未来,基于priors的方法更胜一筹也是有可能的。
所以,千万不要受限于一类方法,不要让自监督学习变成了调参游戏,自监督领域的想象空间其实非常大。
最后,这个总结主要基于自己的思考,也许不一定非常到位,权当抛砖引玉。希望大家都能够设计出有趣又有用的自监督学习任务,为这个领域添砖加瓦。
本文已由原作者授权,不得擅自二次转载。
https://zhuanlan.zhihu.com/p/150224914
References:
Pathak, Deepak, et al. "Context encoders: Feature learning by inpainting."Proceedings of the IEEE conference on computer vision and pattern recognition. 2016.
Walker, Jacob, Abhinav Gupta, and Martial Hebert. "Dense optical flow prediction from a static image."Proceedings of the IEEE International Conference on Computer Vision. 2015.
Noroozi, Mehdi, and Paolo Favaro. "Unsupervised learning of visual representations by solving jigsaw puzzles."European Conference on Computer Vision. Springer, Cham, 2016.
Misra, Ishan, C. Lawrence Zitnick, and Martial Hebert. "Shuffle and learn: unsupervised learning using temporal order verification."European Conference on Computer Vision. Springer, Cham, 2016.
Wu, Zhirong, et al. "Unsupervised feature learning via non-parametric instance discrimination."Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018.
Grill, Jean-Bastien, et al. "Bootstrap Your Own Latent: A New Approach to Self-Supervised Learning."arXiv preprint arXiv:2006.07733(2020).
5
看到这里的,都是真爱,12 月份的福利来啦~
本书的内容,可以看下图的简介(上下滑动查看):
作者黄佳,新加坡埃森哲公司高级顾问,人工智能专家,机器学习和云计算高级工程师。
6
参与活动的记得加我微信,谨防失联。
推荐阅读
• 川普的退休生活?不,是AI算法的宅舞演绎• 「充电学习」物体检测的主流方法• 「修炼开始」一文带你入门深度学习