2022年12月JournalofGreenScienceandTechnology第24卷第24期收稿日期:2022-11-02基金项目:国家重点研发计划项目(编号:2019YFC1804903);国家自然科学基金(编号:41771413);北京市自然科学基金(编号:8202013)作者简介:李心治(1997-),男,硕士研究生,研究方向为地理信息系统与大数据可视化分析。通讯作者:张健钦(1977-),男,教授,博士生导师,研究方向为城市大数据可视化、智能交通、智慧应急等。基于CatBoost的重金属污染场地风险等级预测模型李心治1,2,张健钦1,2,胡昊3,姜会忠1,2,李星辰1,2,陆楠3(1.北京建筑大学测绘与城市空间信息学院,北京102616;2.自然资源部城市空间信息重点实验室,北京102616;3.生态环境部信息中心,北京100029)摘要:为有效利用污染场地环境大数据,在未进行钻孔取样的情况下对重金属污染场地进行风险等级的预测评估,研究构建了基于机器学习模型CatBoost的重金属污染场地风险等级预测模型,并分析制定了模型学习样本的制作方法,依据污染行业专家知识结合场调数据特点建立指标集作为输入值,综合采用单因子指数法、地累积指数法与潜在生态风险指数法对场地内各网格地块的风险等级进行了划分并作为模型输出值。模型训练和测试结果表明:当输入特征为8项指标,即面积、硬化面积、生产经营时间、排污、地下水埋深、饱和带土壤渗透性、地下防渗措施和高密度电阻时,CatBoost性能最优,评价指标准确率为0.846、宏查准率为0.855、宏查全率为0.842、宏F1值为0.848。进一步与XGBoost、LightGBM两种机器学习模型进行了对比分析。结果表明:CatBoost模型对重金属污染地块的风险等级具有最佳的预测效果。构建的重金属污染场地风险等级预测模型可在无需采样数据的条件下对污染地块的风险等级进行预测,可为场地调查修复提供决策信息。关键词:重金属污染;风险等级;CatBoost;分类预测中图分类号:X524文献标识码:A文章编号:1674-9944(2022)24-0140-07RiskLevelPredictionModelofHeavyMetalContaminatedSitesBasedonCatboostLiXinzhi1,2,ZhangJia...