822023年第2期总第458期广西经济GuangxiJingji大数据背景下基于k-means聚类分析的上市公司财务预警模型研究区梦怡[摘要]选取2000—2020年广西上市公司数据作为样本,构建广西上市公司财务预警模型,可以得出以下结论:第一,在构建模型时,指标选择对研究结果尤为重要,在构建k-means聚类分析财务预警模型时要消除多重共线性的影响。第二,在对广西上市公司进行风险研究时,可以重点研究博士比重、净利率、资产负债率和总资产周转率等4个指标。这4个指标对广西上市公司有较大影响,合理优化企业自身资源,能让企业在激烈的市场竞争中取得更好更快的发展。[关键词]大数据;k-means;逐步回归;聚类分析;上市公司[中图分类号]F832;F275[文献标识码]A[文章编号]1007-2462(2023)02-0082-05随着国家经济的发展,广西地区生产总值由2001年的2279.34亿元上升至2020年的22156.69亿元,人均地区生产总值亦从2001年的5058元增至2020年的44309元。2022年1月1日,《区域全面经济伙伴关系协定》(RCEP)正式生效,广西抢抓机遇,多措并举高质量实施RCEP,与RCEP成员国的贸易规模达到一个新水平,通过中国—东盟博览会平台,助推中国—东盟自由贸易区3.0版。自1993年广西柳工机械股份有限公司在上海证券交易所上市以来,截至2021年12月31日,广西共有上市公司39家,板块总市值为3111.30亿元。广西上市公司的发展影响着广西区域经济的发展,为了确保广西经济的稳定、健康,有必要构建广西上市公司财务预警综合评价模型,以及时发现广西上市公司存在的风险并尽早解决,避免上市公司财务风险对广西经济造成更深远的影响。一、文献回顾目前对广西上市公司的研究较少,截至2022年11月,在中国知网搜索关键词“上市公司”,有4万多条结果,而将“广西上市公司”作为关键词进行搜索,仅得到100多条结果。本文将研究对象聚焦于广西上市公司,根据广西上市公司2001年至2021年的相关数据,使用逐步回归和k-means聚类分析构建广西上市公司财务预警综合评价模型,对广西上市公司的财务状况经营成果进行评价。LiL等[1]认为k-means聚类分析可以筛选风险较大的投资,通过分散投资将风险进行二次分散,以最小的风险获得最高的回报。FangZ、ChiaoC[2]通过k-means聚类分析对100支上市公司股票进行研究,认为k-means聚类分析可以把股票准确区分为高绩效股票和低绩效股票,这为投资者投资股票提供了很好的参考。ZhuZ、LiuN[3]认为k-means聚类分析方法可以有效避免人为划分阈值带来...