何恺明一作论文 MAE 已有人复现！PyTorch 版！（附链接）

共 671字，需浏览 2分钟

2021-12-23 07:19

来源：AI算法与图像处理
本文多图，建议阅读5分钟
CV大神何恺明论文复现。

大家好，我是红色石头。之前介绍过CV大神何恺明又出力作！论文「Masked Autoencoders Are Scalable Vision Learners」

Arxiv链接：

https://arxiv.org/pdf/2111.06377.pdf

现在，有人复现了这篇文章，而且是PyTorch的版本！

复现代码：

https://github.com/pengzhiliang/MAE-pytorch

何恺明大佬新作一发出来，知乎上就有众多大佬在讨论

具体链接：

https://www.zhihu.com/question/498364155

除了大家对何恺明大佬的工作的肯定外（当然部分认为novelty不足），也引发对未来CV工作的思考，是否会引领类似去年 transformer那样子的热潮？亦或是证明ViT的各种改变可能都是没有意义的。

这次何恺明大佬又把握了技术发展的趋势，NLP和CV互相融合的工作看来会是大势所趋。

论文链接：

https://arxiv.org/pdf/2111.06377.pdf

复现代码：

https://github.com/pengzhiliang/MAE-pytorch

项目结构：

详情：

编辑：于腾凯