第40卷第2期2023年6月爆破BLASTINGVol.40No.2■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■Jun.2023doi:10.3963/j.issn.1001-487X.2023.02.014基于特征工程的XGBoost爆破块度预测研究*夏淑媛,董永峰,王利琴(河北工业大学人工智能与数据科学学院,天津300401)摘要:露天矿山台阶爆破后矿岩的平均块度是衡量爆破质量的重要指标。早期研究主要依靠经验公式总结、岩体力学模型计算等方法,这些方法存在准确率不够、主观性强等缺点。近期,机器学习算法应用于块度预测,但基本通过专家经验选用固定的特征来进行预测且预测稳定性不足,泛化能力差。针对以上缺点,提出一种基于特征工程的极端梯度提升树(XGBoost)爆破块度预测模型。以太原袁家村铁矿为研究区,采集近半年的爆破数据作为原始数据,综合考虑影响平均块度的各方面因素。首先使用随机森林(RF)的袋外估计和互信息(MI)两种方法分别进行特征选择,其次将不同方法选择的特征子集集成并利用特征之间的互信息进行去冗余,最后以MSE的值为评价指标选出最优特征子集表征爆破,完成基于数据驱动的特征选择。更进一步,在最优特征子集上采用XGBoost算法进行块度预测,通过均方误差(MSE)、平均绝对误差(MAE)两个指标构成模型的评价体系将文章所提方法与其他传统机器学习算法进行对比。对比结果表明:文章提出方法比传统机器学习算法的预测准确率更高,可以为爆破的管理与控制提供科学指导。关键词:随机森林;互信息;Xgboost模型;平均块度中图分类号:TD235.3文献标识码:A文章编号:1001-487X(2023)02-0097-05收稿日期:2023-01-04作者简介:夏淑媛(1986-),女,实验师、硕士研究生学历,主要从事数据挖掘、机器学习、物联网等方面的教学和科研工作,(E-mail)447463736@qq.com。通讯作者:董永峰(1976-),男,教授、博士研究生学历,主要从事大数据,知识图谱,机器学习等方面的教学和科研工作,(E-mail)dongyf@hebut.edu.cn。基金项目:河北省高等学校科学技术研究项目(ZD2022082);河北省高等教育教学改革研究与实践项目(2020GJJG027)StudyonBlastingLumpinessbyXGBoostModelbasedonFeatureEngineeringXIAShu-yuan,DONGYong-feng,WANGLi-qin(SchoolofArtificialIntelligence,HebeiUniversityofTechnology,Tianjin300401,China)Abstract:Theaveragelumpinessoforerockisanimportantindextomeasuretheblastingquality.Theearlyre-...