PSPNet | 语义分割及场景分析
点击上方“程序员大白”,选择“星标”公众号
重磅干货,第一时间送达
语义分割的目标仅仅是获知已知对象的每个像素的类别标签。
场景解析是基于语义分割的,它的目标是获知图像内所有像素的类别标签。
![](https://filescdn.proginn.com/c00cdbd655f81f79449599869adc59cd/c47cff80fc1a51fd4db74ae00173cf78.webp)
场景解析
通过使用金字塔池化模块(Pyramid Pooling Module),在整合基于不同区域的上下文后,PSPNet在效果上超过了FCN、DeepLab和DilatedNet等时下最佳的方法。PSPNet最终:
获得2016年ImageNet场景解析挑战的冠军
在PASCAL VOC 2012和Cityscapes数据集上取得当时的最佳效果
工作已发表于2017年CVPR,被引量超过600次。(SH Tsang @ Medium )
本文提纲
1. 对全局信息的需要
2.金字塔池化模块
3. 一些细节
4. 模型简化研究
5. 与时下最佳方法的比较
1. 对全局信息的需要
(c) 原有的未经上下文整合的FCN,(d) 经上下文整合的PSPNet
关系错误匹配:FCN基于外观将黄色框内的船预测为“汽车”。但根据常识,汽车很少会出现在河面上。
类别混淆:FCN将框内的对象一部分预测为“摩天楼”,一部分预测为“建筑物”。这些结果应当被排除,这样对象整体就会被分在“摩天楼”或“建筑物”其中一类中,而不会分属于两类。
细小对象的类别:枕头与床单的外观相似。忽略全局场景类别可能对导致解析“枕头”一类失败。
因此,我们需要图像的一些全局特征。
2.金字塔池化模块
特征提取后的金字塔池模块(颜色在本图中很重要!)
红色:这是在每个特征map上执行全局平均池的最粗略层次,用于生成单个bin输出。
橙色:这是第二层,将特征map划分为2×2个子区域,然后对每个子区域进行平均池化。
蓝色:这是第三层,将特征 map划分为3×3个子区域,然后对每个子区域进行平均池化。
绿色:这是将特征map划分为6×6个子区域的最细层次,然后对每个子区域执行池化。
(c).2. 1×1 卷积用于降维
(c).3. 双线性插值用于上采样
(c).4. 连接上下文聚合特征
所有不同级别的上采样特征map都与原始特征map(黑色)连接在一起。这些特征映射融合为全局先验。这就是金字塔池模块(c)的终止。
(d)
![](https://filescdn.proginn.com/af8ccd8d6443fc436958e93909716177/05d4d72b113b47151dbcd0d4ce445a4e.webp)
验证集用于模型简化测试。
![](https://filescdn.proginn.com/7e6df14a0a9a6860f23a530f407bd1d6/515770d624d8ae7389542e96d18e8153.webp)
ResNet50-Baseline: 基于ResNet50的扩张FCN。
‘B1’和‘B1236’: bin大小分别为{1×1}和{1×1,2×2,3×3,6×6}的池化特征map。
‘MAX’和‘AVE’: 最大池操作和平均池操作
‘DR’: 降维.
![](https://filescdn.proginn.com/b81d8b8e56753097404642141d754b8e/a0747380d7374ed3a19f9d6fb74746de.webp)
![](https://filescdn.proginn.com/202f43ea0012f324ba433bd56d0171ab/b499ebd2397b999087f5bfc297e7022b.webp)
![](https://filescdn.proginn.com/754ee11736ba7cb431cc07adb3cf4e01/482447a8b2dc3dbcf3d697a816e7ac51.webp)
![](https://filescdn.proginn.com/43a92de25ff709e7fc3857371f0b2331/4447720a5eca987ba4c767c3d82d5a8c.webp)
5. 与最先进方法的比较
5.1. ADE2K - ImageNet场景解析挑战赛2016
![](https://filescdn.proginn.com/bbde360882e796255f9a3126364b6917/7f71637bce4367d04dae26410e0cabb1.webp)
5.2. PASCAL VOC 2012
![](https://filescdn.proginn.com/839eae27ff2248439565b01295243b71/dc78375c1087c0da197c7341814c0516.webp)
![](https://filescdn.proginn.com/2a2849d896cb60cba531eeacf37a84e6/50d5ac30d090096c03071769c0ff25a2.webp)
5.3. Cityscapes
![](https://filescdn.proginn.com/4b615f81d96bbb80054602f1236e49d9/ac68f7238bbfafbce9346a4bbdf545fd.webp)
![](https://filescdn.proginn.com/f49376f02bb48a2b6f5f04ed14e845ee/0b32f35f8aaa15d1fb3e48aaa8e7d791.webp)
![](https://filescdn.proginn.com/9ae083709dc3f048d72214e4228f58d9/d93cfb1e27868f211f74cfd3e1eb1a55.webp)
推荐阅读
关于程序员大白
程序员大白是一群哈工大,东北大学,西湖大学和上海交通大学的硕士博士运营维护的号,大家乐于分享高质量文章,喜欢总结知识,欢迎关注[程序员大白],大家一起学习进步!