第44卷第3期河北科技大学学报Vol.44,No.32023年6月JournalofHebeiUniversityofScienceandTechnologyJune2023文章编号:1008-1542(2023)03-0246-10航班到港延误时长预测及特征分析丁建立,杨锟(中国民航大学计算机科学与技术学院,天津300300)摘要:为破除XGBoost模型的黑盒特性,增强模型的说服性,提出一种基于SHAP的可解释性航班到港延误时长预测模型。首先,对航班历史数据、天气数据进行融合,在融合数据的基础上进行异常值处理,并利用递归特征消除方法进行特征选择;其次,构建航班延误时长预测模型,利用遗传算法进行参数调优,并与目前常用的模型进行对比;最后,在航班延误时长预测的基础上结合SHAP模型,从总体特征和特征间的相互关系2个角度分析特征的重要程度。实验结果表明,经过遗传算法调优的XGBoost模型预测精度更高,其中MAE降低了8.94%,RMSE降低了19.85%,MAPE降低了6.15%,且其模型精度更高。因此,SHAP模型破除了XGBoost模型的黑盒特性,增强了模型的可解释性,可为降低航班延误时长提供技术支持。关键词:航空运输管理;延误预测;极限梯度提升;参数寻优;可解释性;特征选择中图分类号:TP183文献标识码:ADOI:10.7535/hbkd.2023yx03005收稿日期:2023-02-27;修回日期:2023-05-15;责任编辑:王淑霞基金项目:国家自然科学民航联合重点基金(U2233214,U2033205)第一作者简介:丁建立(1963—),男,河南洛阳人,教授,博士,ccf会员(17170M),主要从事智能仿生算法、机器学习方面的研究。E-mail:jlding@cauc.edu.cn丁建立,杨锟.航班到港延误时长预测及特征分析[J].河北科技大学学报,2023,44(3):246-255.DINGJianli,YANGKun.Predictionandcharacteristicanalysisofflightarrivaldelay[J].JournalofHebeiUniversityofScienceandTech-nology,2023,44(3):246-255.PredictionandcharacteristicanalysisofflightarrivaldelayDINGJianli,YANGKun(DepartmentofComputerScienceandTechnology,CivilAviationUniversityofChina,Tianjin300300,China)Abstract:TobreaktheblackboxfeatureofXGBoostmodelandenhanceitspersuasiveness,aninterpretableflightdelaypredictionmodelbasedonSHAPwasproposed.Firstly,basedonthefusionofflighthistorydataandweatherdata,outlierswereprocessedandfeatureswereselectedbyrecursivefeatureeliminationmethod.Secondly,aflightdelaydura...