投稿网址:www.stae.com.cn2023年第23卷第17期2023,23(17):07420⁃08科学技术与工程ScienceTechnologyandEngineeringISSN1671—1815CN11—4688/T引用格式:廖列法,姚秀,李奎.基于RoBERTa与改进局部离群因子算法的专利新颖性测量[J].科学技术与工程,2023,23(17):7420⁃7427.LiaoLiefa,YaoXiu,LiKui.PatentednoveltymeasurementbasedonRoBERTaandimprovedlocaloutlieralgorithm[J].ScienceTechnologyandEngineering,2023,23(17):7420⁃7427.基于RoBERTa与改进局部离群因子算法的专利新颖性测量廖列法1,姚秀2∗,李奎2(1.江西理工大学软件工程学院,南昌330000;2.江西理工大学信息工程学院,赣州341000)摘要现有的专利新颖性测量方法需要依赖特定的领域知识以及专家的介入,性能差且耗时长,为此,提出了一种不依赖特定领域知识及专家的全自动化系统的识别新颖性专利的方法。首先利用鲁棒优化的BERT方法(robustlyoptimizedBERTapproach,RoBERTa)表示专利向量,以解决需要依赖技术领域的知识来表示专利的多义词问题;其次,利用数据点的密度分布并结合信息熵改进局部离群因子(localoutlierfactor,LOF)算法来确定离群点个数及数据点集,提高离群点的检测精度,结合RoBERT与改进的LOF在数值尺度上度量专利的新颖性。实验验证表明,所提方法测量的专利新颖性的得分与现有文献中的相关专利指标显著相关,并且识别出的新颖性专利具有更高的技术影响。关键词专利新颖性;RoBERTa;信息熵;局部离群因子算法;离群点检测中图法分类号TP391;文献标志码A收稿日期:2022⁃09⁃13;修订日期:2023⁃04⁃03基金项目:国家自然科学基金(71462018,71761018)第一作者:廖列法(1975—),男,汉族,江西玉山人,博士,教授,硕士研究生导师。研究方向:自然语言处理。E⁃mail:liaolf@126.com。∗通信作者:姚秀(1998—),女,汉族,江西吉安人,硕士研究生。研究方向:...