2023年第6期江雪梨,等:改进随机森林模型在人口空间化中的应用引文格式:江雪梨,熊永良,郭红梅,等.改进随机森林模型在人口空间化中的应用[J].测绘通报,2023(6):155-160.DOI:10.13474/j.cnki.11-2246.2023.0186.改进随机森林模型在人口空间化中的应用江雪梨1,熊永良1,郭红梅2,赵真2,张莹2,孟雅湉1(1.西南交通大学地球科学与环境工程学院,四川成都611756;2.四川省地震局,四川成都610041)摘要:基于随机森林模型的人口空间化方法未考虑人口空间分布非平衡性,利用Bootstrap采样加剧样本的不均衡性,使其不具有代表性,造成模型预测精度较低。针对此问题,本文以成都市为例,通过相关性分析提取影响人口分布的特征因子,基于K-means++聚类算法对数据集进行聚类处理,然后利用Bootstrap采样法从各簇中抽取等量的数据融合作为训练子集构建改进随机森林模型,并与传统随机森林模型进行对比。运用改进后的随机森林模型对成都市2020年人口数据进行空间化,并与WorldPop数据集进行精度对比。结果表明,基于改进随机森林的人口空间化模型整体精度达80.5%,较改进前提高了约3.4%,有效提高了模型预测精度;相较于WorldPop数据集,基于改进随机森林模型的人口空间化结果在拟合度及精度方面均较优。关键词:人口空间化;随机森林;K-means++聚类;成都市中图分类号:P208文献标识码:A文章编号:0494-0911(2023)06-0155-06ApplicationofimprovedrandomforestmodelinpopulationspatializationJIANGXueli1,XIONGYongliang1,GUOHongmei2,ZHAOZhen2,ZHANGYing2,MENGYatian1(1.FacultyofGeosciencesandEnvironmentalEngineering,SouthwestJiaotongUniversity,Chengdu611756,China;2.EarthquakeAdministrationofSichuanProvince,Chengdu610041,China)Abstract:Therandomforestmodel-basedpopulationspatializationmethoddoesnottakeintoaccountthenon-equilibriumofpopulationspatialdistribution,andtheuseofBootstrapsamplingexacerbatestheunevennessofthesample,makingitunrepresentativeandresultinginlowmodelpredictionaccuracy.Forthisproblem,thisstudytakesChengducityasanexample,thecharacteristicfactorsofaffectingthepopulationdistributionareextractedthroughcorrelationanalysis,thedatasetisclusteredbasedontheK-means++clusteringalgorithm,andthenanequalamountofdatafromeachclusterisfusedasatrainingsubsetu...