112/CHINAMANAGEMENTINFORMATIONIZATION112/CHINAMANAGEMENTINFORMATIONIZATION2023年1月第26卷第2期中国管理信息化ChinaManagementInformationizationJan.,2023Vol.26,No.2基于文本信息的企业信用风险预测研究张皓楠1,张红梅1,2(1.贵州财经大学大数据应用与经济学院(贵阳大数据金融学院),贵州550025;2.贵州科技创新创业投资研究院,贵州550025)[摘要]文章运用文本数据挖掘法,将发生信用风险企业和未发生信用风险企业年报中的语调剥离出来后,对其进行量化,研究年报语调对信用风险预测有效性的影响。在实证研究中,文章对若干传统财务变量使用因子分析法,通过Logistic模型将所提取的成分与语调变量进行信用风险预测。预测结果表明:发生信用风险的企业语调更为消极,并且语调悲观程度与信用风险发生的概率显著正相关。通过对比语调变量加入前后的预测结果的ROC曲线可知,在以财务变量为主要依据的信用风险预测中加入语调变量可以提高预测的有效性。[关键词]信用风险;文本数据挖掘;因子分析;Logistic模型;文本语调doi:10.3969/j.issn.1673-0194.2023.02.037[中图分类号]F276[文献标识码]A[文章编号]1673-0194(2023)02-0112-040引言全球金融发展速度迅猛,社会各主体间的金融往来日渐频繁,由此也带来了错综复杂的利益关系,一旦某一利益环节发生信用风险,就会造成不可估量的连带损失。因此,国内外学者将预防信用风险视为重要的研究对象。信用风险通常指借款人、证券发行人或交易方不愿或无力履行合约而构成的违约[1]。杨莲[2]将FocalLoss修正交叉熵损失函数引入信用风险评价模型,对若干个体样本进行风险预测,实证结果表明该预测方法可以提升对困难样本的识别能力。王重仁[3]针对互联网信贷行业个人信用风险评估,提出一种贝叶斯参数优化方法和XGBoost算法,实证结果表明此方法优于支持向量机等传统的预测模型。罗方科[4]将商业银行互联网金融个人小额贷款数据带入Logistic模型,筛选出对信用风险影响较为显著的因素。由于公司企业相对于个人借款者、投资者具有更大的影响力,其发生信用风险产生的危害也更具破坏力,因此提高对公司企业信用风险的预测精准度也是风险管理领域的热点问题。有些学者从信用特征角度出发,对2169家中国A股上市公司数据进行实证分析,得出按特征划分的模型具有更高的判别精度。相较于信用特征,更多学者基于最优信用风险指标组合的视角对信用风险进行研究,如研究发现不同财务指...