第49卷第8期2023年8月ComputerEngineering计算机工程基于证据句与图卷积网络的文档级关系抽取马建红,龚天,姚爽(河北工业大学人工智能与数据科学学院,天津300401)摘要:针对基于图卷积网络的文档级关系抽取模型存在未对邻居节点贡献度加以区分及句子噪声的问题,在将证据句融入图卷积网络进行消息传播的基础上,构建一种改进的文档级关系抽取模型。基于启发式路径得到包含证据句的路径信息,在包含证据句的路径信息基础上进行关系抽取,统计所有样本路径中的句子占比,并在异构图中融入证据句路径信息进行相似度计算,得到与样本相关的3句证据句。在证据句信息的基础上对不同类型的边根据贡献度区分规则赋予相应权重,并使用图卷积操作对节点信息进行二次增强,最终实现文档级关系抽取。在DocRED数据集上的实验结果表明,该模型的F1值达到56.96%,相比于Paths、Hin-Glove等基线模型提升了0.42~13.51个百分点,验证了在文档图中融入证据句信息对于提升文档级关系抽取模型性能的有效性。关键词:文档级关系抽取;图卷积网络;证据句;异构图;权重开放科学(资源服务)标志码(OSID):源代码链接:https://github.com/gt-gt97/EASG中文引用格式:马建红,龚天,姚爽.基于证据句与图卷积网络的文档级关系抽取[J].计算机工程,2023,49(8):104-110.英文引用格式:MAJH,GONGT,YAOS.Document-levelrelationextractionbasedonevidentialsentencesandgraphconvolutionalnetwork[J].ComputerEngineering,2023,49(8):104-110.Document-LevelRelationExtractionBasedonEvidentialSentencesandGraphConvolutionalNetworkMAJianhong,GONGTian,YAOShuang(SchoolofArtificialIntelligence,HebeiUniversityofTechnology,Tianjin300401,China)【Abstract】Indocument-levelrelationextractionmodelsbasedonaGraphConvolutionalNetwork(GCN),thecontributionofneighboringnodesandsentencenoisecannotbedistinguished.Toaddressthisissue,animproveddocument-levelrelationextractionmodelisbuilt,wherebyevidentialsentencesareintegratedintotheGCNformessagepropagation.Basedonheuristicpaths,pathinformationcontainingevidentialsentencesisobtainedtoextractrelations.Theproportionofsentencesinallsamplepathsiscounted,andevidentialsentencepathinformationisintegratedintoheterogeneousgraphsforsimilaritycalculatio...