·论著·原始研究·基于特征筛选与机器学习的医疗保险报销比例预测研究杨赫祎1#,冯玉1#,李天俊2,卢施岐1,黄磊11.西南交通大学数学学院(成都611756)2.四川大学华西医院医保办公室(成都610041)【摘要】目的对国家医疗保障疾病诊断相关分组中胸部大手术组的医疗保险报销比例进行数据驱动的辅助预测,为医疗保险经办机构及医疗机构精准有效地预测按病种分组医保支付情况提供参考。方法以四川省某大型三甲医院2020年的胸部大手术病例信息为样本,通过多元线性回归模型和基于特征筛选的机器学习改进方法,将全部数据集的70%作为训练数据集,30%作为测试数据集,对医保支出情况进行预测。结果随机森林、Logistic回归、支持向量机三种机器学习方法在筛选特征数量相同时,预测效果无统计学差异。预测效果最优的模型准确率为78.96%,敏感性为83.93%,特异性为71.27%,精确度为0.8188,AUC值为0.8414,Kappa值为0.6108。结论疾病诊断数量、手术操作数量及患者年龄对报销比例影响较大。治疗费、材料费、手术费及西药费为住院费用的主要方面。基于特征筛选的机器学习改进方法优于传统的统计线性模型,且选取合适的特征数量能够使模型在较高的效率下达到更好的预测效果。【关键词】国家医疗保障疾病诊断相关分组;特征筛选;机器学习;医疗保险;报销比例;预测StudyonhealthinsurancereimbursementratepredictionbythecombinedmethodoffeatureselectionandmachinelearningYANGHeyi1,FENGYu1,LITianjun2,LUShiqi1,HUANGLei11.SchoolofMathematics,SouthwestJiaotongUniversity,Chengdu611756,P.R.China2.OfficeofMedicalInsurance,WestChinaHospital,SichuanUniversity,Chengdu610041,P.R.ChinaCorrespondingauthor:HUANGLei,Email:stahl@swjtu.edu.cn【Abstract】ObjectiveToperformdata-driven,assistedpredictionofhealthinsurancereimbursementratiosforthemajorthoracicsurgerygroupinCHS-DRG,inadditiontoprovidinganoptionalsolutionforhealthinsuranceprovidersandmedicalinstitutionstoaccuratelyandeffectivelypredictthereferencesofhealthinsurancepaymentsforthepatientgroup.MethodsUsingtheinformationonmajorthoracicsurgerycasesfromalargetertiaryhospitalinSichuanprovincein2020asasample,70%ofthetotaldatasetwasusedasatrainingdatasetand30%asatestdataset.Thisdatawasusedtopredicthealthinsurancespendingthroughamultiplelinea...