基于U-Net检测卫星图像上的新增建筑-轻识

向AI转型的程序员都关注了这个号???

机器学习AI算法工程公众号：datayx

在国土监察业务中，很重要的一项工作是监管地上建筑物的建、拆、改、扩。如果地块未经审批而存在建筑物，那么需要实地派人去调查是否出现了非法占地行为。如果地块卖给了开发商但是没有实际建设，那么需要调查是否捂地或者是开发商资金链出现问题。如果居民住房/商业用地异常扩大，那么需要调查是否存在违章建筑。对于大城市及其郊区来说，不可能靠国土局公务员来每天全城巡查，而可以靠高分辨率图像和智能算法来自动完成这项任务。具体来说，需要靠高分系列卫星图像（米级分辨率），和深度学习算法来革新现有的工作流程。

本次任务覆盖广东省部分地区数百平方公里的土地，其数据共3个大文件，存储在OSS上，供所有参赛选手下载挖掘。

卫星数据以Tiff图像文件格式储存。quickbird2015.tif是一张2015年的卫星图片，quickbird2017.tif是一张2017年的卫星图片。每个Tiff文件中有4个波段的数据：蓝、绿、红、近红外。本次比赛的卫星数据为多景数据拼接而成，这是国土资源工作中常见的实际场景。比赛数据在蓝、绿两个波段有明显的拼接痕迹，而红、近红外波段的拼接痕迹不明显。建议选手挑选波段使用数据，或者在算法中设计应对方案。每个像元以16-bit存储。Quickbird卫星数据的详细描述可以参见：

https://www.satimagingcorp.com/satellite-sensors/quickbird/

2015年度的国土审批纪录也以Tiff图像文件格式储存，命名为Cadastral2015.tif。其中包含了国土审批数据中大约5%的地块，这些地块的位置在图像中数值定为1，其余地区的位置在图像中数值定为0。值得注意的是：政府在2015年度审批的国土建设地块并不一定在2017年完成了建设，同时选手获取的审批地块图片也仅是所有审批纪录中的一小部分。因此，本次大赛国土审批纪录不是一份训练数据，而只是一个线索。

在初赛第一阶段，我们将提供一份人工精确标注的小型数据集，便于所有选手上手，命名为tinysample.tif。但是，我们推荐选手对国土审批地块图片进行人工甄别，筛选建造自己的训练集。决赛最终使用的训练集可以来自本次大赛所覆盖的全部地区。

图1:卫星图片和国土审批记录叠加在一起

上图中红／绿色地块是2015年政府批复下来的不同土地开发项目。
Tiff数据可以用各种编程语言读写。比如在Python语言中可以使用PIL库(Pillow版本), 请参见https://python-pillow.org ；或者是GDAL库，请参见https://pcjericks.github.io/py-gdalogr-cookbook/ 。同时，推荐选手使用开源软件QGIS来观察／编辑卫星图片数据，请参见www.qgis.org 。

基于U-Net检测卫星图像上的新增建筑