基于多因素的煤矿突水事故预测随机森林模型胡文博,孙延辉,马红林(新上海一号煤矿,内蒙古鄂尔多斯市016200)摘要:高效、准确、快速地提高突水水源类型预测精度,是防治煤矿发生突水事故的重要手段。以真实矿井数据为例,提出一种简单快速预测煤矿突水水源类型的预测方法。以Ca2+、Mg2+、Na++K+、Cl-、SO2-4、HCO-36类离子实测浓度作为突水水源类型输入参数,建立一种考虑多因素的有监督随机森林突水水源类型预测模型。研究结果表明,模型预测值准确,部分测试集和预测集相关性系数R2为0.99;MSE(均方误差)为0.0047,RSS(残差平方和)为0.0425,预测精度(PA)为95%,相较于Fisher判别法精度更高。整体预测相关性系数、均方误差和残差平方和分别为0.999,0.0005,0.0049,预测精度为90%以上,最大误差范围在10%以内,预测效果较好。关键词:矿井突水;随机森林;预测模型0引言矿井水害作为煤矿事故的五大灾害之一[12],严重制约着煤矿安全高效生产。据统计,2001—2020年[3],煤矿事故水害发生起数总体呈现递减的趋势,但仍有发生,如图1所示。这就说明,找到简单、快速、高效及准确率高的煤矿突水水源识别方法对防治煤矿水害事故发生有着极其重要的意义。图12001—2020年我国煤矿水害发生起数目前,已有大量学者通过不同的方法对矿井突水水源判断进行研究,取得了丰富的研究成果。黄敏等[4]通过改进的随机森林模型预测了矿井突水水源识别,通过主成分分析降维提高了模型的预测精度。成小雨等[5]使用支持向量机和随机森林对回采工作面瓦斯涌出量进行了预测,通过交叉验证降维筛选出权重较高的因素作为输入特征,降低了预测模型的绝对、相对误差,提高了预测精度。吴奉亮等[6]基于随机森林回归,预测煤矿瓦斯涌出量,提取累计影响权重为90%的特征变量作为输入变量,奖励模型特征变量维度,从而增加了模型的准确度。刘翔等[7]基于改进随机森林算法的岩石爆破块度预测,通过随机森林预测了岩石爆破块度。此外,其他学者利用改进的方法或随机森林方法对岩爆等级[8]、露天煤矿粉尘质量浓度进行预测[9]、岩性预测[10],以及通过神经网络[11]、支持向量机[12]、Fisher判别法[13]对突水水源识别进行预测。然而,上述方法在预测过程中,当影响因素较多时,大多学者往往利用主成分分析或者粒子群等方法对影响因素进行筛选,剔除掉权重较小的因素,在提高预测准确度的同时,忽略了权重值低的因素影响,使得预测结果不能完全反映现场实际。鉴于此,本文提出了一种基于多因素考虑的随机森林预测方法,综合考虑各个突...