【数学笔记】研赛论文:19A题基于神经网络的无线电波传播损耗预测模型
共 2894字,需浏览 6分钟
·
2021-06-06 02:26
点击蓝字 关注我们
接上一篇文章(【数学笔记】研赛论文:19A题 无线智能传播模型 1),继续把数学建模笔记捡起来,持续更新数学建模相关。
随着5G NR技术的发展,5G在全球范围内的应用也在不断地扩大。运营商在部署5G网络的过程中,需要合理地选择覆盖区域内的基站站址,进而通过部署基站来满足用户的通信需求。在整个无线网络规划流程中,高效的网络估算对于精确的5G网络部署有着非常重要的意义。无线传播模型正是通过对目标通信覆盖区域内的无线电波传播特性进行预测,使得小区覆盖范围、小区间网络干扰以及通信速率等指标的估算成为可能。由于无线电波传播环境复杂,会受到传播路径上各种因素的影响,如平原、山体、建筑物、湖泊、海洋、森林、大气、地球自身曲率等,使电磁波不再以单一的方式和路径传播而产生复杂的透射、绕射、散射、反射、折射等,所以建立一个准确的模型是一项非常艰巨的任务。
本文以观测点的平均信号接受功率(RSRP)的PCRR以及RMSE指标为优化目标。旨在准确预测观测点的RSRP值。针对这一优化问题,本文从模型分析和数据分析的角度对特征进行提取,并基于这些特征先后建立两个神经网络。
问题重述
问题一,本质上是模型分析任务。
针对关于无线电波传播的模型的特点和适用范围进行汇总分析,学习其特征引入方式,重点对其中的Okumura-Hata 模型、Cost 231-Hata 模型、SPM 模型,对其参数的选择进行剖析,确立本文模型的备选特征。
问题二,归结为数据分析任务。
对题目提供的数据集进行数据清洗和可视化处理。通过重复随机抽样、取平均值的方式,对16个变量进行因子分析,得到6个解释性好的因子,对变量进行组合与转化。基于已有数据和相关系数检验,得到19个有效特征。
问题三,工程实践任务,建立模型进行求解。
本文建立单GBDT模型和多目标融合模型,对原始数据特征和统计特征进行学习,对PCRR以及RMSE进行目标优化。
问题1-模型分析
常见无线电波传播模型
近年来,由于通讯技术的快速发展,无线电波应用越来越广泛,出现了大量研究无线电波传播模式的文献与模型,根据辐射源覆盖范围的的不同,可分为大区模型、小区模型、微区模型;根据传播模式性质的不同,可分为:经验模型、半经验模型、确定性模型;根据分析电波传播方向的不同,可分为正演模型、反演模型。 对于常见文献中的模型,本文对其核心的模型思想、模型特点及适用范围进行提炼得到下表。
经典统计模型优缺点汇总表
模型特征提取
1)链路距离 d,即基站与观测点的水平位置距离。
2)基站发射机绝对高度 hb,即基站发射机距地面高度与基站海拔高度之和。
3)观测点绝对高度 hb,即观测点的海拔高度。
4)载波频率f,即基站发射机中心频率f,且lg(f)常常与lg(A)结合来影响电波信号
传播损耗。
5)场景纠正常数K,即区域建筑物和地形对该观测点的电波信号传播损耗的影响。
综上所述,通过问题一的分析,本文可以初步得到特征lg(d)、lg(hb)、lg(hm)、lg(hm)∗lg(d)、F(lg(f),lg(A))
问题2-数据分析
针对问题二,首先需要对数据进行可视化,对于已有数据各个变量的基本统计性质具有初步的了解,进一步,对数据进行清洗,去除收集时存在的非偶然性误差,以及无关的具有多重共线性的变量。然后,本文在数据采样的基础上,使用因子分析的方法对变量进行组合,对部分分类变量进行合理的排序与数值转化。最后,基于问题一中模型分析与因子分析结果,对已有变量进行组合形成特征,并对特征进行数值化表达与相关性测定。
数据清洗:
对于部分异常数据(建筑物高度和地物类型标识不符、空间距离与信号功率不符),本
文在模型训练前先进行了数据清洗。
针对三类数据进行清洗,建筑物高度和地物类型标识不符的、空间距离与信号强度不符的、无用变量的剔除。
因子分析:
对清洗后的数据进行因子分析,探究变量组合。
由于数据量过大,本文首先采用随机采样的方法获得样本大小为1048574 数据,对剔
除小区编号和RSRP 值的16 各变量进行因子分析。
借助变量的相关系数矩阵、反应像相关矩阵、巴特利特球度检验和KMO检验方法进行分析。
变量组合:
因子分析的结果对于变量之间的组合具有指导意义,不论从因子分析模型、还是从距离的现实意义角度,结合Cell X 和X 变量、Cell Y 和Y 变量、Cell Altitude 和Altitude 变量的组合都是合理的。第四组变量组合显示出Height、Electrical Downtilt、Mechanical Downtilt、RS Power 四个变量的组合,虽然都是有关基站发射机的变量,但其特征结合方式并不是很顺理成章的,仍需要进一步分析。在第五组变量组合中,Cell Building Height、Cell Clutter Index、Building Height、Clutter Index 主要包括地物类型索引和格点建筑物高度,是影响电波传输方式的重要因素,其结合是合理的。第六组变量组合将Azimuth、Frequency Band 两个变量结合起来,其原因仍有待分析。
特征相关性测定:
综上,本文得到了16个原始数据特征、3个统计模型矫正特征以及7个新的组合的经验特征,对上述的26个特征进行相关性测定并排序,得到如图表。
问题3-求解
针对问题三,首先,基于问题一和问题二中设计和选择了有效特征,本文通过官方给出的训练集,建立了2 种无线信号传播预测模型。其次,本文将对这2 种模型进行依次的说明与训练求解。
1 GBDT模型
GBDT 是由决策树模型衍生而来的一种集成学习的方法,它采用前向分布算法和加模型的方法,来实现学习的优化过程,本文使用改进的LightGBM模型。通过前文的数据清洗与特征提取后,本文对整体数据集进行了10 折划分,以RSRP为标签,均方根误差(RMSE)为优化目标,然后训练。
LightGBM 的模型结构比较简单,且训练速度迅速,有利于特征的快速尝试与探究,在本文的多次尝试后,得到了以下的特征重要性表。
2 融合模型与多目标学习
在有了前面的单GBDT 模型的基础之上,本文对其模型的输出与原有特征进行了融合,然后将整体融合特征,作为了基于TensorFlow 的多层神经网络模型的输入数据。
模型评价
本文在进行特征提取过程中充分结合变量的实际意义,综合使用模型分析与数据分析的方法,将定性分析和定量分析充分结合,使模型更加合理。
本文在进行建模的过程中,充分考虑了模型的不同使用场景,使得模型对于不同区域类型的数据均能给出较好的预测结果。
本文通过深刻分析讨论问题,剔除部分目标相关性较低的特征,使得模型更加简洁高效,试图用最简单的模型和算法解决了复杂的问题。