有哪些好看的CNN模型画法？-轻识

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

编辑：忆臻
本文仅作为学术分享，如果侵权，会删文处理
机器学习算法与自然语言处理报道

有哪些好看的CNN模型画法？

作者：bingo

https://www.zhihu.com/question/62509034/answer/199177562

谢邀。第一次答DL相关题目，如有错误，欢迎指正。

前几天刚好跟同学讨论到画的好看的CNN图，正好答一下问题，自己也做下整理收藏。

说起CNN的模型图，要从经典CNN的相关paper开始：

LeNet，1998年；AlexNet，2012年；ZF-net，2013年；NIN，2013年；GoogLeNet (InceptionV1)，2014年；VGG，2014年；Batch Norm (InceptionV2)，2015年；InceptionV3 ，2015年；ResNet，2015年；InceptionV4，2016年。

依次上图（多图预警）：

LeNet

AlexNet

ZF-net

NIN

GoogLeNet

VGG

Batch Norm

通用数据预处理，没有提出新的网络模型

InceptionV3

ResNet

InceptionV4

在经典的CNN基础上，大家都会根据自己的算法和结构作出一些改进。

个人认为比较好看的CNN结构图：

Andrej Karpathy大神主页（Andrej Karpathy Academic Website）贴出了部分论文的图：

Large-Scale Video Classification with Convolutional Neural Networks paper里横向类似Alexnet的图以及纵向多个level的fusion图，与之类似的是另一篇paper里面为了表示各种level pooling做的层级concat的图：

Image Feature Learning for Cold Start Problem in Display Advertising模仿ZF-net做的图。

Two-Stream Convolutional Networks for Action Recognition in Videos视频分析经典的Two-stream CNN图：

同样视频分析Limin Wang做了不同改进的视频应用CNN结构图：Limin Wang

最后放一个我们Pooling the Convolutional Layers in Deep ConvNets for Video Action Recognition里面的图：

个人理解和简单总结

根据上面一些经典的CNN结构图和大神们paper里面的CNN模型图，可以看出大家还是在参考经典CNN结构的基础上作出自己的一些变化：例如Cold Start paper模仿ZF-net的图，我们Pooling the Convolutional paper和视频分析的很多paper参考Two-Stream的图，在layer上面进行Fusion以及Pooling通常会参考上面Karparthy Sports-1M以及Beyond Short Snippets中Layer concatenation类似的图。

当然除了直接放图之外，VGG还放出了一个表格，清晰的表明每一层的结构和参数。有时候，为了强调自己模型在网络局部的改进，也会有局部区域图出现例如InceptionVX里面卷积核大小不断变化的一系列图，ResNet中shorcut结构：

作者：天机
https://www.zhihu.com/question/62509034/answer/201313069

前两天看到一个高端的。

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目52讲

在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~