分享
组合预测模型构建及在合肥市...(2.5)浓度预测中的应用_孙飞燕.pdf
下载文档

ID:345801

大小:1.99MB

页数:8页

格式:PDF

时间:2023-03-22

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
组合 预测 模型 构建 合肥市 2.5 浓度 中的 应用 飞燕
第39卷第1期2023年2月山西大同大学学报(自然科学版)Journal of Shanxi Datong University(Natural Science Edition)Vol.39 No.1Feb.2023组合预测模型构建及在合肥市PM2.5浓度预测中的应用孙飞燕,袁宏俊*,张圣梅(安徽财经大学统计与应用数学学院,安徽 蚌埠 233030)摘要:Dice系数是衡量两个序列接近程度的指标,将广义诱导有序加权平均(GIOWA)算子和Dice系数相结合,提出了基于GIOWA算子和Dice系数的组合预测模型,并且给出了优性组合预测的定义。将该模型应用到合肥市PM2.5浓度预测上,选取2014-2021年共84期的PM2.5浓度及核心影响要素的月度数据进行分析,将组合预测结果与单项预测结果进行对比,并分析了组合预测模型中参数取值发生变化时对组合预测权重、预测效果评价指标和Dice系数影响情况。实证结果表明所建立的组合预测模型的预测效果要优于单项预测模型。关键词:组合预测;PM2.5浓度;GIOWA算子;Dice系数中图分类号:X513文献标识码:Adoi:10.3969/j.issn.1674-0874.2023.01.011随着经济和工业的发展,人民的生活质量逐渐提高,但各种环境污染问题也接踵而至。环境污染有很多类,其中近些年热议的问题就是大气污染,雾霾也是大气污染中的一种。PM2.5是空气中直径小于 2.5 微米的颗粒物,是构成霾的主要成分,对空气的质量与能见度有重大的影响。胡玉筱等1将多元线性回归应用到 PM2.5预测中。王敏等2将人工神经网络应用到 PM2.5的预测中。影响 PM2.5的因素比较多,且不同的单项预测方法注重的方向不同,利用的数据也有差异,所以仅仅只用单项预测方法进行预测,有可能因为利用的信息不够充足,而使最后的预测结果与实际值的误差较大。为了尽可能地提取各单项预测中所提供的有效信息,Bates J M和 Grange C W J3在 1969 年 提 出 了 组 合 预 测 方法,之后许多学者在组合预测上也进行了大量的研究。传统的组合预测方法是采用定权方法将单项预测方法组合起来,但是不同的单项预测方法在不同时点预测的准确度也是不同的。Yager最先提出了有序加权平均(OWA)算子的概念,之 后 国 内 外 的 学 者 在 此 基 础 上 进 行 了 研 究 推广。Jos M 等4将 OWA 算子进行推广,提出了广义 诱 导 有 序 加 权 平 均(GIOWA)算 子 的 概 念,GIOWA 算子包含了广义有序加权平均(GOWA)算子和诱导有序加权平均(IOWA)算子的主要特征。陈华友等5在诱导有序加权平均(IOWA)算子概念的基础上,提出了诱导有序加权调和平均(IOWHA)算子的概念。袁宏俊等6将贴近度与 IOWA 算子结合,构建了一种新的变权系数组合预测模型。刘家军7将 Theil 不等系数与 IO-WHA 算子结合构建组合预测模型,并用此模型预测年用电量。组 合 预 测 方 法 在 PM2.5预 测 中 也 得 到 了 应用。康俊锋等8基于 XGBoost 和 LSTM 进行改进得到变权组合模型 XGBoost-LSTM(Variable),并将此模型应用到上海市 PM2.5浓度预测中。王学梅9在三次平滑预测模型的基础上,结合遗传算法以及模拟退火算法,建立模拟退火+遗传+三次指数平滑组合模型对 PM2.5浓度进行预测。黄鹰等10对传统的 BP 神经网络模型进行改进,建立灰色 BP-NN 优化组合模型,运用该模型对北京市 PM2.5浓度进行预测。Dice 系数是一种衡量两个序列相似度的函收稿日期:2022-07-11基金项目:安徽财经大学研究生科研创新基金项目ACYC2021398;安徽省哲学社会科学规划项目AHSKY2020D42;安徽省高校自然科学重点项目2022AH050602;安徽财经大学科研基金资助重大项目ACKYA21004作者简介:孙飞燕(1999-),女,安徽宿州人,硕士研究生,研究方向:经济预测模型方法。袁宏俊(1978-),安徽庐江人,教授,硕士生导师,通信作者。E-mail:文章编号:1674-0874(2023)01-0054-082023年数,陶跃华11给出了 Dice 系数的计算公式,现有研 究 中 大 多 将 Dice 系 数 用 于 图 像 分 割 中。将Dice 系数引用到组合预测中,结合 GIOWA 算子,构建了一种新的基于 GIOWA 算子与 Dice 系数的组合预测模型,并将其运用到合肥市 PM2.5浓度的预测中,结果表明该组合预测方法可以有效地提升预测精度。1 基于GIOWA算子和Dice系数的组合预测模型构建1.1 Dice系数的概念设一个时间序列的实际值为 xt,t=1,2,N,对时间序列进行分析,利用n个单项预测方法对时间序列进行预测,第i种单项预测方法在t时刻的预测值为xit。组合预测方法是将不同的单项预测值赋予不同的权重,并采用累加或累乘的方式结合起来。记组合预测模型中n种单项预测方法的加权系数分别为l1,l2,ln,且满足:i=1nli=1,li 0,i=1,2,n。令x?t为t时刻的组合预测值,则有:x?t=i=1nlixit,t=1,2,N。定义111记:i=2t=1Nxtxitt=1Nx2t+t=1Nx2it,=2t=1Nxtx?tt=1Nx2t+t=1Nx?2t。(1)其中,i为第i种单项预测方法的预测值序列 xi1,xi2,xiN与实际值序列 x1,x2,xN之间的Dice系数,称为组合预测方法的预测值序列 x?1,x?2,x?N与实际值序列 x1,x2,xN之间的Dice系数。设L=(l1,l2,ln)T,Fij=XTiXj=t=1Nxi txj tF=(Fi j)n n。,(2)其中,i,j=1,2,n,L表示加权系数列向量,Fi j表示向量Xi与Xj的内积,F表示n n的方阵,F为组合预测信息矩阵。则:t=1N(i=1nlixi t)2=t=1N(i=1nj=1nliljxi txj t)=i=1nj=1nlilj(t=1Nxi txj t)=i=1nj=1nliljFi j=LTFL,(3)将式(3)带入到式(1),则 Dice 系数可表示为如下形式:i=2t=1Nxtxi tt=1Nx2t+Fi i,i=1,2,n,=2i=1mlit=1Nxtxi tt=1Nx2t+LTFL,(4)显然,i 1,i=1,2,n,1,并且由 Dice 系数的表达式可知,Dice系数越大表示组合预测值越接近于实际值,组合预测方法越有效。特别地,当组合预测值序列与实际值序列相等时,=1。1.2 GIOWA算子的概念定义 25设a1,x1,a2,x2,an,xn为二维数组,令:fl()a1,x1,a2,x2,an,xn=()i=1nlixa-index(i)1,(5)则称函数fl为a1,a2,an所产生的 n 维广义诱导有序加权平均算子,简称 GIOWA 算子,其中,xi为第i 种单项预测的预测值,ai称为xi的诱导值,a-index(i)是诱导值a1,a2,an按从大到小顺序排列的第i个数的下标,L=(l1,l2,ln)T是与fl有关的加权向量,且满足:i=1nli=1,li 0,i=1,2,n。GIOWA算子中的参数有无穷多种取法,取不同的值,可以构造不同的算子。(1)当=1时,GIOWA算子退化为IOWA算子,表达式为:fl()a1,x1,a2,x2,an,xn=i=1nlixa-index(i)。(6)(2)当 0时,GIOWA算子退化为IOWGA算孙飞燕等:组合预测模型构建及在合肥市PM2.5浓度预测中的应用55山西大同大学学报(自然科学版)2023年子,表达式为:fl()a1,x1,a2,x2,an,xn=i=1nxlia-index(i)。(7)(3)当=-1时,GIOWA算子退化为IOWHA算子,表达式为:fl()a1,x1,a2,x2,an,xn=1/()i=1nli/xa-index(i)。(8)1.3 优性组合预测的概念组合预测模型根据建立的某个准则的优劣程度,可以分为劣性组合预测、非劣性组合预测和优性组合预测。定义3 设max=max i,i=1,2,n,min=min i,i=1,2,n,max,min分别表示n种单项预测方法的预测值序列和实际值序列之间的 Dice 系数的最大值和最小值,(l1,l2,ln)为组合预测值与实际值的 Dice 系数,则有:(1)如 果(l1,l2,ln)max,则称组合预测模型为优性组合预测。1.4 基于 GIOWA 算子和 Dice 系数的组合预测模型构建将ait作为诱导值,ait为第i种预测方法在第t时刻的预测精度,则有ait=1-|xt-xitxt,|xt-xitxt max 0(l1,l2,l3)max=-1(l1,l2,l3)max所以,由定义3知实证分析中三种参数取值下的组合预测模型均为优性组合预测。表6 单项预测和组合预测的Dice系数模型Lasso回归PLS回归神经网络组合预测(=1)组合预测(0)组合预测(=-1)Dice系数0.9940.9850.9930.9970.9970.9973 灵敏度分析通过上文的计算可得,基于GIOWA算子和Dice系数的变权系数组合预测模型,在参数取-1,0,1时均为优性组合预测。从Dice系数来看,组合预测方法的预测值与实际值之间的Dice系数均大于单项预测,从3种误差结果和平均精度来看,组合预测模型的预测效果也比单项预测的好。基于GIOWA算子和Dice系数的组合预测模型中的参数有无穷多种取值方式,并且参数取值不同,对应的最优权重、预测效果以及组合预测值与实际值之间的Dice系数也会发生变化,下面对参数取不同数值的组合预测模型做灵敏度分析。在区间-7,7上讨论参数发生变化对权重、预测效果和Dice系数影响情况。具体结果见图5-图7。由图5可以看出,参数取值在-7,7之间变化时,实证分析的权重l1取值先由大逐渐降低至0.898,再上升并且上升速度逐渐减慢;权重l2取值先由小逐渐上升至0.102,再逐渐下降。特别地,参数取值在-7,7时,权重l3取值为0,这是因为权重l3对应的预测值的预测精度最小。由图6可以看出,参数取值逐渐增大时,实证分析的误差指标MAE、RMSE的变化较为一致,误差值指标MAE和RMSE数值都是由小变大并分别稳定在2.37,2.96左右。参数变化对组合预测的均方百分比误差和平均精度影响较小,总体分别保持在(2.2%,2.4%)和(92,7%,93.8%)之间。由图7可以看出,参数取值逐渐增大时,组合预测值和实际值之间的Dice系数在由大逐渐减少并稳定在0.997左右。在参数 -7,4)时Dice系数变化较明显,(4,7时Dice系数变化趋于平缓。4 结论基于广义诱导有序加权平均(GIOWA)算子和Dice系数的概念,提出了基于GIOWA算子和Dice系数组合预测模型,通过求解非线性规划模型可以获得最优权系数。将此组合预测模型运用到合肥市的月平均PM2.5浓度预测上,还探究了参数取不同值时组合预测效果。将组合预测结果的预测精度与各单项预测的预测精度进行对比,结果显示在参数取-1,0,1时,组合预测模型的预测精度和Dice系数都要高于单项预测模型。并且从组合预测的灵敏度分孙飞燕等:组合预测模型构建及在合肥市PM2.5浓度预测中的应用59山西大同大学学报(自然科学版)2023年图5变化时权重l1,l2,l3取值变化图6变化时RMSE、MAE、MSPE和平均精度的取值变化图7变化时Dice系数的取值变化析中,也可以看出参数取值在-7,7范围时,组合预测的预测精度和Dice系数均高于单项预测模型。根据优性组合预测的定义,所提出的组合预测为优性组合预测,这说明基于GIOWA算子和Dice系数的组合预测模型能有效的提高预测精度。但是选取的是Lasso回归、PLS回归和神经网络3种单项预测方法,如果选择预测效果更好的单项预

此文档下载收益归作者所有

下载文档
收起
展开