安徽职业技术学院学报JOURNALOFANHUIVOCATIONALANDTECHNICALCOLLEGE第22卷第1期2023年3月Vol.22No.1Mar.2023收稿日期:2022—12—09基金项目:安徽省哲学社会科学规划项目“在线医疗社区中个人健康信息保护机制构建”(项目编号:AHSKQ2016D78);安徽工商职业学院教学研究项目“后疫情时代高校双线混融教学模式的实施与探索”(项目编号:2021xjjy21)作者简介:刘帅(1981—),女,汉族,安徽安庆人,律师,讲师,研究方向:信息法学、信息资源管理。基于文本挖掘的网络伪健康信息特征及情感分析研究刘帅1,2,钱鹏博3,孙静4,严子芊5(1.安徽工商职业学院管理学院,安徽合肥231131;2.北京德恒(合肥)律师事务所,安徽合肥230031;3.复旦大学文献信息中心,上海200433;4.安徽大学管理学院,安徽合肥230601;5.上海大学管理学院,上海200444)摘要:本研究对存在网络伪健康信息的文章进行分析,利用python爬取微博及微信伪健康文章,采用LDA(隐含狄利克雷分布)主题模型和情感分析,挖掘其主题特征及不同情感倾向,最后基于健康信息质量评价体系构建伪健康文本主题模型,挖掘伪健康信息的文本和情感态度特征及两者潜在关联,为建立健康信息自动过滤机制、改善网络健康信息环境,提升健康信息质量提供有益参考。关键词:伪健康信息;LDA主题模型;情感分析中图分类号:G203文献标识码:A文章编号:1672—9536(2023)01—0046—07Abstract:Thisstudyanalyzesthearticleswithonlinepseudo-healthinformation,andextractstheirthemecharacteristicsanddifferentemotionaltendenciesbyusingPythontocrawlpseudo-healtharticlesinWeiboandWeChat,aswellasusingLDAthememodelandsentimentanalyses.Itconstructsapseudo-healthtextthememodelbasedonthehealthinformationqualityevaluationsystemandextractsthepseudo-healthinformationtexts,theemotionalattitudecharacteristicsandtherelationsbetweenthem.Italsoprovidessomebeneficialreferencefortheestablishmentofanautomaticfilteringmechanismforhealthinformation,andtheimprovementofthehealthonlineinformationenvironmentandthequalityofhealthinformation.Keywords:pseudohealthinformation;LDAtopicmodel;sentimentanalysis随着“互联网+”时代的到来,网络已成为大众了解健康信息的主要渠道,而社交平台的强关系性、匿名性以及信息传播的快速性,客观上为伪健康信息的传播提供了...