电子设计工程ElectronicDesignEngineering第31卷Vol.31第6期No.62023年3月Mar.2023收稿日期:2021-11-23稿件编号:202111152基金项目:四川省科技厅项目(2019YJ0705)作者简介:成彦衡(1987—),男,江苏连云港人,工程师。研究方向:医院信息化、计算机网络、网络信息安全。信息时代的迅猛发展,使信息能够更加及时和广泛地传播到各种社交平台,为人们实时提供最新的信息。但是,当今网络技术的飞速发展,为黑客提供了可入侵的空间,其通过各种手段在网络上发布一些虚假信息和非法传播内容,给网络信息共享带基于K近邻算法的网络敏感信息过滤方法成彦衡1,黄宇2(1.连云港市第四人民医院,江苏连云港222000;2.成都理工大学工程技术学院,四川成都614000)摘要:面对当前方法受到数据稀疏性影响,导致敏感信息过滤效果差的问题,提出了基于K近邻算法的网络敏感信息过滤方法。以K近邻算法中用到的评分实际数据稀疏度为评判依据,对网络敏感信息进行分类,避免了过滤过程受数据稀疏性的影响。构造敏感信息决策树,在树节点上添加敏感关键词,利用K近邻分类算法计算特征值方差矩阵的权重和累积权重。将计算结果添加到反敏感信息库中,引入时间和主题相关度变量参数计算相似度,通过查找网络上的敏感素材,筛选符合条件的敏感信息。由实验结果可知,该方法平均绝对误差和标准化平均绝对误差与其他方法相比数值最小,分别为0.19和0.20,说明其网络敏感信息过滤效果较好。关键词:K近邻算法;网络敏感信息;过滤;数据稀疏度;相似度中图分类号:TN99.34文献标识码:A文章编号:1674-6236(2023)06-0105-04DOI:10.14022/j.issn1674-6236.2023.06.022NetworksensitiveinformationfilteringmethodbasedonK-nearestneighboralgorithmCHENGYanheng1,HUANGYu2(1.TheFourthPeople’sHospitalofLianyungangCity,Lianyungang222000,China;2.TheEngineering&TechnicalCollegeofChengduUniversityofTechnology,Chengdu614000,China)Abstract:Facingtheproblemthatthecurrentmethodsareaffectedbydatasparsity,resultinginpoorfilteringeffectofsensitiveinformation,anetworksensitiveinformationfilteringmethodbasedonK-nearestneighboralgorithmisproposed.BasedontheactualdatasparsityusedintheK-nearestneighboralgorithm,thenetworksensitiveinformationisclassifiedtoavoidtheinfluenceofdatasparsityonthefilteringprocess.Asensitiveinf...