【学术前沿】基于三维地面激光扫描数据的常用建筑材料自动分类

深度学习入门笔记

共 4177字,需浏览 9分钟

 ·

2021-03-13 15:05

点击上方“公众号”可订阅哦!


声明:本文只是针对个人学习记录,侵权可删。本人自觉遵守《中华人民共和国著作权法》和《伯尔尼公约》等法律,其他个人或组织等转载请保留此声明,并自负法律责任。论文版权与著作权等全归原作者所有。





01

文章摘要


建筑材料自动分类在建筑施工管理和设施管理中具有重要的应用价值,是近几十年来建筑材料自动分类研究的热点。目前提出的材料自动分类方法主要是利用建筑材料的视觉特征,基于二维图像进行分类。带有内置摄像头的地面激光扫描仪(TLS)可以生成一组包含建筑材料表面几何形状的彩色激光扫描数据。激光扫描数据不仅包括建筑材料的视觉特征,还包括材料反射率和表面粗糙度等其他属性。通过提供更多的属性,激光扫描数据有可能提高建筑材料分类的准确性。因此,本研究旨在利用机器学习技术开发一种基于TLS数据的常见建筑材料分类方法。该技术利用材料反射率、HSV颜色值和表面粗糙度作为材料分类的特征。建立了10种常用建筑材料的激光扫描数据数据库,并利用机器学习技术进行模型训练和验证。通过对不同机器学习算法的比较,最佳算法的平均分类准确率为96.7%,验证了所提出方法的可行性。



02

文章导读


过去的十年中,基于最新信息技术的建筑材料自动分类一直是建筑、工程和建筑(AEC)行业的一个有前途的研究方向。材料自动分类可以提高各种任务的效率,包括损伤检测和现场材料管理和跟踪。此外,建筑信息模型(BIM)受到了学术界和工业界的广泛关注,越来越多地应用于建筑项目的设计、施工和运营阶段。生成反映建筑现状的建筑信息模型(bim)已经成为一项重要的任务,它可以应用于各种应用,如现有建筑的操作和维护(O&M)以及建筑性能分析。as-is BIM不仅包含建筑的几何信息,还包含建筑材料等建筑元素的非几何信息。材料信息对于许多BIM应用来说是必不可少的,例如物体的三维表示和建筑能量模拟。因此,为了生成语义丰富的包含材料信息的as-is bim,对建筑材料的自动分类有很高的要求。
在过去的几年里,应用机器学习技术对建筑材料进行自动分类已经成为AEC行业的一种流行方法。所提出的材料分类方法根据采集数据的类型分为基于图像和基于激光扫描数据两种。目前,基于图像的材料分类方法得到了广泛的应用。基于图像的方法的核心技术是利用建筑材料的颜色、纹理、粗糙度、投影等视觉特征进行自动分类。然而,基于图像的方法在很大程度上受到光照条件的影响。不同的光照条件强烈影响材料的视觉特性,给基于图像的建筑材料分类带来了困难。此外,物体和未知视点上的纹理较差也对基于图像的材料分类的鲁棒性和准确性产生了负面影响。

地面激光扫描技术为建筑材料的自动分类提供了一个新的前景。带有内置摄像头的TLS不仅可以捕捉视觉特征,还可以捕捉建筑材料的内在属性,如材料反射率。因此,考虑到所提供的信息类型更多,且对变化的光照条件具有更高的鲁棒性,TLS在实现更精确的材料分类方面具有很大潜力。此外,TLS由于其高测量精度和速度,已被广泛用于构建代表建筑现状的bim。因此,使用TLS数据进行建筑材料分类不需要额外的数据收集,如果TLS数据已经为构建现有bim收集。尽管TLS具有诸多优势,但采用TLS数据进行建筑材料分类的研究较少。

本研究旨在开发一种基于TLS数据的常用建筑材料自动分类方法。所开发的方法对于各种应用程序都是有用的,特别是当使用TLS数据构建语义丰富的as-is bim时,需要材料信息。




03

实验设计


确定用于建筑材料自动分类的特征。对于每个扫描点,TLS收集一组由反射激光束强度、RGB颜色值和x-y-z坐标组成的属性。根据收集到的属性计算出一组用于材料分类的特征。特征包括1)材料反射率,2)颜色,和3)表面粗糙度。

本研究需要确定一套常见的建筑材料作为目标材料。已经建立了一些建筑材料库,用于基于图像的材料分类。因此,我们以现有的建筑材料库为参考,创建了一个通用的建筑材料集。


主要图表:












04

实验


建筑材料的选择

本研究需要确定一套常见的建筑材料作为目标材料。已经建立了一些建筑材料库,用于基于图像的材料分类。因此,我们以现有的建筑材料库为参考,创建了一个通用的建筑材料集。
如图6所示,本研究考虑了十种不同类型的材料,包括混凝土、砂浆、石头、金属、绘画、木材、石膏、塑料、陶器和陶瓷。尽管玻璃被广泛应用于建筑中,但由于TLS难以捕捉透明物体,因此在本研究中没有选择玻璃。在这十类材料中,每一类都选取一种特定的常用建筑材料作为样本。



数据收集与处理

采用FARO FocusS70 TLS采集10种材料的激光扫描数据。如表1所示,该TLS的测量范围为0.6 ~ 70 m,垂直视场300°,水平视场360°。光束出口直径为2.12 mm,散度为0.3 mrad。这10种建筑材料的激光扫描数据来自新加坡国立大学(NUS)的建筑。收集的扫描数据包括建筑内部(即天花板、墙壁和地板)和外部立面。对于每种材料,在不同的光照条件下从不同的站点采集扫描数据,以确保采集到的数据具有代表性。


模型训练

在计算ρ值、HSV值和rav值后,分别创建2 m < R < 4m和4m < R < 10 m的数据集进行训练。2m < R < 4m的数据集包含41,000个数据点(每一种建筑材料大约有4100个数据点),4m < R < 10 m的数据集包含53,000个数据点(每一种建筑材料大约有5300个数据点)。每个数据点代表一个样本,包括建筑材料类别标签、ρ值、HSV颜色空间中的H、S和V值以及Ravalue。
本文主要考虑了建筑材料分类是一个多类分类问题。模型训练和验证的总体工作流程如图7所示。分别对两个数据集进行了训练和验证。我们使用每个数据集的80%来训练分类模型,剩下的20%来测试训练后的模型。为了找到最佳的特征组合,对不同的特征组合(ρ、HSV值和Ra)进行了测试。此外,比较中也考虑了Irvalue和RGB值。为了找到最佳的分类模型,研究了不同类型的监督学习分类器,包括决策树(DTs)、判别分析(DAs)、朴素贝叶斯(NBs)、支持向量机(SVMs)、k近邻(KNNs)和集成





05

实验结果


特征和分类器的比较


由表2可知,当2 m < R < 4 m时,使用ρ、HSV和Ra作为特征,集成作为分类器的分类精度最高,达到96.2%。从表3可以看出,当4 m < R < 10 m时,使用ρ、HSV、Raas特征和集合作为分类器的分类精度最高,达到97.1%。



在分类器的比较方面,实验结果表明集成算法是最好的分类器。这一结果与之前研究的结论一致。从表2和表3的实验结果可以看出,分类精度最高的算法是Bootstrap-aggregated Decision Trees(即Bagged Trees),这是集成算法之一。



每种建筑材料的精度分析


为了进一步了解材料分类结果,我们使用混淆矩阵分析了具有最高分类精度的情况下的分类性能(即使用ρ + Ra+ HSV作为特征,使用Bagged Trees算法作为分类器)。将2 m < R < 4 m和4 m < R < 10 m的分类结果取平均值,混淆矩阵如图8所示。混淆矩阵的每一行都显示了建筑材料样本真实类别的TP和FN比率。



为了进一步分析砂浆材料TP率低的原因,我们绘制了平行坐标图来可视化多元数据。如图9所示,我们比较了石头、砂浆和油漆的特征分布(ρ、H、S、V、Ra)。对于某一特征,如果一种材料的数据离散程度较高或与另一种材料的数据重叠较大,则该特征对提高该材料的分类精度的作用较小。与油漆材料相比,砂浆材料在S、V、Ra等多个特征上有更高的分散度,导致砂浆与其他材料有较大的重叠,导致砂浆的TP率较低。同时也发现砂浆的H值和S值与石材的H值和S值严重重叠,这也解释了为什么7%的砂浆数据被错误的归类为石材。




06

结论


本研究提出了一种基于TLS数据的常用建筑材料分类方法。在该方法中,材料反射系数ρ、HSV颜色和表面粗糙度很少作为分类特征。ρ值是某一物质的固有特性,它可以从激光的反射强度Ir中推断出来。结果表明,irs与cosθ/R2呈线性关系,ρ是线性函数系数的一部分。因此,每个扫描点的ρ值是通过对扫描点邻近点的Irand cosθ/R2值拟合一个线性函数得到的。HSV颜色在本研究中使用而不是RGB颜色,因为HSV颜色对不同的光照条件表现出更好的鲁棒性。HSV颜色是由原始激光扫描数据获得的RGB颜色计算出来的。Ravalue是从扫描点的邻点到邻点拟合平面的平均正交距离计算的。


为了验证所提出的技术,本研究选择了十种常见的建筑材料,包括混凝土、砂浆、石头、金属、油漆、木材、石膏、塑料、陶器和陶瓷。使用FARO FocusS70 TLS采集10种不同材料的激光扫描数据。激光扫描数据在MATLAB2019a中进行处理,计算上述特征。

为了找到最佳的特征组合,对不同的特征组合进行了测试。此外,还探讨了不同的监督学习分类器,包括决策树(DTs)、判别分析(DAs)、朴素贝叶斯(NBs)、支持向量机(SVMs)、最近邻(KNNs)和集成。实验结果表明,使用ρ、HSV、Raas特征和集成作为分类器,实现了最高的分类准确率96.7%。实验结果也证实了ρ色在材料分类方面比Ir色有更好的效果,HSV色优于RGB色。


为了进一步测试一种建筑材料的识别精度,我们还采用了一类分类方法对分类模型进行了训练和验证。本文采用OC-SVM和SVDD,这两种分类器在以往的研究中都被证实是处理一类分类问题的最佳分类器。实验结果表明,OC-SVM和SVDD的平均准确率分别为85.5%和86.5%,进一步证明了该方法的可行性。



 END

深度学习入门笔记

微信号:sdxx_rmbj

日常更新学习笔记、论文简述

浏览 31
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报