第40卷第3期计算机应用与软件Vol.40No.32023年3月ComputerApplicationsandSoftwareMar.2023一种面向中医文本的实体关系深度学习联合抽取方法杨延云杜建强*聂斌罗计根贺佳(江西中医药大学计算机学院江西南昌330004)收稿日期:2020-08-12。国家重点研发计划项目(2019YFC1712301);国家自然科学基金项目(61762051,61562045);江西省自然科学基金项目(20202BAB202019);江西省教育厅科技项目(GJJ190863);江西省研究生创新专项资金项目(YC2019-S358)。杨延云,硕士生,主研领域:自然语言处理,数据挖掘。杜建强,教授。聂斌,副教授。罗计根,硕士。贺佳,硕士。摘要目前实体识别和关系抽取任务大多采用流水线方式,但该方法存在错误累积、忽略两个任务相关性和信息冗余等诸多问题。结合中医文本的特点,提出一种基于深度学习的中医实体关系联合抽取方法。该方法使用改进的序列标注策略,将中医的实体关系联合抽取转换成序列标注任务,词向量与字符向量并联拼接作为双向LSTM-CRF输入,利用双向LSTM神经网络强大的特征提取能力,以及CRF在序列标注上的突出优势,结合优化的抽取规则完成中医实体关系联合抽取。在中医语料库上的实验结果表明,实体关系联合抽取的F1值可以达到80.42%,与传统流水线方法以及其他方法相比,实验效果更佳。关键词实体关系联合抽取深度学习字词向量拼接中医文本中图分类号TP391文献标志码ADOI:10.3969/j.issn.1000-386x.2023.03.033AJOINTEXTRACTIONMETHODOFENTITIESANDRELATIONSFORTRADITIONALCHINESEMEDICINETEXTBASEDONDEEPLEARNINGYangYanyunDuJianqiang*NieBinLuoJigenHeJia(SchoolofComputer,JiangxiUniversityofTraditionalChineseMedicine,Nanchang330004,Jiangxi,China)AbstractAtpresent,theentityrecognitionandrelationshipextractiontasksmostlyusethepipelinemethod,whichhastheproblemsoferroraccumulation,ignoringtherelevanceoftwotasks,andinformationredundancy.CombiningthecharacteristicsoftraditionalChinesemedicine(TCM)text,thispaperproposesajointextractionmethodofentitiesandrelationsfortraditionalChinesemedicinetext.TheimprovedsequencelabelingstrategywasusedtoconvertthejointextractionofentitiesandrelationsofTCMintoasequencelabelingtask.ThewordvectorandcharvectorparallelsplicingwasusedastheinputofBiLSTM-CRF.Usingthestrongfeatureextractio...