■学术研究22本文引用格式:薛云飞.基于机器学习的汽车二氧化碳排放量预测研究[J].自动化与信息工程,2023,44(1):22-26;45.XUEYunfei.Researchonpredictionofautomobilecarbondioxideemissionsbasedonmachinelearning[J].Automation&InformationEngineering,2023,44(1):22-26;45.基于机器学习的汽车二氧化碳排放量预测研究薛云飞(重庆交通大学机电与车辆工程学院,重庆400074)摘要:针对汽车尾气排放物中二氧化碳(CO2)的排放量测量设备价格昂贵且测量精度低的问题,进行基于机器学习的汽车二氧化碳排放量预测研究。首先,利用斯皮尔曼等级相关系数分析汽车特征之间的相关性,并过滤冗余特征;然后,利用随机森林算法筛选出影响CO2排放量的4个核心特征;最后,分别基于线性回归、梯度提升树、XGBoost、支持向量机4种机器学习算法建立CO2排放量的预测模型,并通过模型效果对比和网格搜索调参,确定最佳的预测模型为基于梯度提升树算法构建的模型。预测值和真实值的对比结果表明,基于梯度提升树算法构建的模型具有较高的预测精度,能有效预测不同汽车每公里的CO2排放量。关键词:机器学习;CO2排放量;斯皮尔曼等级相关系数;随机森林算法;预测模型中图分类号:TP181文献标志码:A文章编号:1674-2605(2023)01-0004-06DOI:10.3969/j.issn.1674-2605.2023.01.004ResearchonPredictionofAutomobileCarbonDioxideEmissionsBasedonMachineLearningXUEYunfei(SchoolofMechatronicsandVehicleEngineering,ChongqingJiaotongUniversity,Chongqing400074,China)Abstract:Aimingattheproblemofthehighpriceandlowmeasurementaccuracyoftheemissionmeasurementequipmentofcarbondioxide(CO2)inautomobileexhaustemissions,theresearchonthepredictionofautomobilecarbondioxideemissionsbasedonmachinelearningiscarriedout.Firstly,thecorrelationbetweenautomobilefeaturesisanalyzedbyusingSpearmanrankcorrelationcoefficient,andredundantfeaturesarefiltered;Then,therandomforestalgorithmisusedtoscreenoutfourcorecharacteristicsthataffecttheemissionofCO2;Finally,thepredictionmodelofCO2emissionsisestablishedbasedonfourmachinelearningalgorithms,namelylinearregression,gradientliftingtree,XGBoostandsupportvectormachine,andthebestpredictionmodelisdeterminedbasedongradientliftingtreealgorithmthroughmodeleffectcomparisonand...