长春理工大学学报(自然科学版)JournalofChangchunUniversityofScienceandTechnology(NaturalScienceEdition)Vol.46No.1Feb.2023第46卷第1期2023年2月收稿日期:2022-06-15基金项目:吉林省教育厅项目(JJKH20210809KJ);长春理工大学大学生创新创业训练计划项目(2021019)作者简介:陈玉天(2001-),男,本科生,E-mail:1362005046@qq.com通讯作者:施三支(1968-),女,博士,教授,E-mail:shisz@cust.edu.cn基于TI-LSTM的文本自动分类算法及应用陈玉天,陈洋,梁恒瑞,孙绍宇,施三支(长春理工大学数学与统计学院,长春130022)摘要:为了有效解决中文文本分类问题,提高文本分类的准确性,提出一种基于TF-IDF和神经网络相结合的文本自动分类算法——TI-LSTM算法。算法根据语义情景提取相应特征,进行量化,通过长短期神经网络(LSTM)对量化后的特征进行训练并赋予权重,最后以特征权重为依据对中文文本信息进行评价。使用TI-LSTM算法可以在保留原文语义的情况下准确提取特征。将该算法应用到长春理工大学贫困生等级分类研究中。与传统的KNN、逻辑回归、朴素贝叶斯和LSTM分类方法进行了比较,训练和测试的准确率都有了较大的提升,准确率达到了86%以上。关键词:神经网络;文本分类;特征提取;文本量化;贫困生中图分类号:OP24文献标志码:A文章编号:1672-9870(2023)01-0130-07ResearchonAutomaticTextClassificationBasedonTI-LSTMCHENYutian,CHENYang,LIANGHengrui,SUNShaoyu,SHISanzhi(SchoolofMathematicsandStatistics,ChangchunUniversityofScienceandTechnology,Changchun130022)Abstract:InordertosolvetheproblemofChinesetextclassificationandimprovetheaccuracy,atextautomaticclassifica-tionalgorithmbasedonTF-IDFandneuralnetworkisproposednamedbyTI-LSTMalgorithminthispaper.Firstly,thecorrespondingfeaturesareextractedandquantifiedinthealgorithmaccordingtothesemanticsituation.Thenthequantifiedfeaturesaretrainedandweightedwiththelong-shorttermneuralnetwork(LSTM).Finally,Chinesetextinformationisevaluatedbasedonfeatureweight.Thismethodhasbeensuccessfullyappliedtotheclassificationofpoverty-strickenstudentsinourschool.ComparedwithtraditionalKNN,logisticregression,naiveBayesandLSTMclassificationmethods,theaccuracyoftrainingandtestinghasbeengreatlyimp...