基于TI-LSTM的文本自动分类算法及应用_陈玉天.pdfVIP免费

下载本文档

阅读 0
下载 0
格式 pdf
大小 1.29 MB
约7页
2023-05-04
收藏
评论
点赞(0)
海报
举报

长春理工大学学报（自然科学版）JournalofChangchunUniversityofScienceandTechnology（NaturalScienceEdition）Vol.46No.1Feb.2023第46卷第1期2023年2月收稿日期：2022-06-15基金项目：吉林省教育厅项目（JJKH20210809KJ）；长春理工大学大学生创新创业训练计划项目（2021019）作者简介：陈玉天（2001-），男，本科生，E-mail：1362005046@qq.com通讯作者：施三支（1968-），女，博士，教授，E-mail：shisz@cust.edu.cn基于TI-LSTM的文本自动分类算法及应用陈玉天，陈洋，梁恒瑞，孙绍宇，施三支（长春理工大学数学与统计学院，长春130022）摘要：为了有效解决中文文本分类问题，提高文本分类的准确性，提出一种基于TF-IDF和神经网络相结合的文本自动分类算法——TI-LSTM算法。算法根据语义情景提取相应特征，进行量化，通过长短期神经网络（LSTM）对量化后的特征进行训练并赋予权重，最后以特征权重为依据对中文文本信息进行评价。使用TI-LSTM算法可以在保留原文语义的情况下准确提取特征。将该算法应用到长春理工大学贫困生等级分类研究中。与传统的KNN、逻辑回归、朴素贝叶斯和LSTM分类方法进行了比较，训练和测试的准确率都有了较大的提升，准确率达到了86%以上。关键词：神经网络；文本分类；特征提取；文本量化；贫困生中图分类号：OP24文献标志码：A文章编号：1672-9870（2023）01-0130-07ResearchonAutomaticTextClassificationBasedonTI-LSTMCHENYutian，CHENYang，LIANGHengrui，SUNShaoyu，SHISanzhi（SchoolofMathematicsandStatistics，ChangchunUniversityofScienceandTechnology，Changchun130022）Abstract：InordertosolvetheproblemofChinesetextclassificationandimprovetheaccuracy，atextautomaticclassifica-tionalgorithmbasedonTF-IDFandneuralnetworkisproposednamedbyTI-LSTMalgorithminthispaper.Firstly，thecorrespondingfeaturesareextractedandquantifiedinthealgorithmaccordingtothesemanticsituation.Thenthequantifiedfeaturesaretrainedandweightedwiththelong-shorttermneuralnetwork（LSTM）.Finally，Chinesetextinformationisevaluatedbasedonfeatureweight.Thismethodhasbeensuccessfullyappliedtotheclassificationofpoverty-strickenstudentsinourschool.ComparedwithtraditionalKNN，logisticregression，naiveBayesandLSTMclassificationmethods，theaccuracyoftrainingandtestinghasbeengreatlyimp...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容