何恺明一作论文 MAE 已有人复现!PyTorch 版!(附链接)

数据派THU

共 671字,需浏览 2分钟

 ·

2021-12-23 07:19

来源:AI算法与图像处理

本文多图,建议阅读5分钟

CV大神何恺明论文复现。

大家好,我是红色石头。之前介绍过CV大神何恺明又出力作!论文「Masked Autoencoders Are Scalable Vision Learners」

Arxiv链接:

https://arxiv.org/pdf/2111.06377.pdf


现在,有人复现了这篇文章,而且是PyTorch的版本!

复现代码:
https://github.com/pengzhiliang/MAE-pytorch

何恺明大佬新作一发出来,知乎上就有众多大佬在讨论

具体链接:

https://www.zhihu.com/question/498364155


除了大家对何恺明大佬的工作的肯定外(当然部分认为novelty不足),也引发对未来CV工作的思考,是否会引领类似去年 transformer那样子的热潮?亦或是证明ViT的各种改变可能都是没有意义的。

这次何恺明大佬又把握了技术发展的趋势,NLP和CV互相融合的工作看来会是大势所趋。


论文链接:
https://arxiv.org/pdf/2111.06377.pdf


复现代码:
https://github.com/pengzhiliang/MAE-pytorch

项目结构:


详情:


编辑:于腾凯

浏览 45
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报