研究论文数据分析与知识发现基于多层交互注意力机制的商品属性抽取*苏明星吴厚月李健黄菊张顺香(安徽理工大学计算机科学与工程学院淮南232001)摘要:【目的】提升模型对文本结构特征和文本特征间关联性的感知,充分挖掘文本内在语义,深层次指导抽取任务。【方法】对文本、句法和词性进行特征抽取,得到各自的特征;将不同的特征进行融合,获得完备的文本结构特征;再设计一个多层交互注意力机制,该机制聚焦于文本结构特征和文本特征之间的深层关联,并采用双线性融合策略,以保证信息的完整性;最后,通过常用的分类器进行属性抽取。【结果】在公开的数据集上,所提模型的属性抽取准确率相比于已有模型至少提高了1.2个百分点。【局限】所提模型对隐式属性词感知迟钝,句子中出现三个以上隐式属性词,模型的性能将大幅度降低。【结论】在显式的商品属性词抽取任务中,建模文本结构特征与文本特征间关联性的方法可以有效提高属性抽取的准确率。关键词:属性抽取交互注意力机制依存关系BiGRUBERT分类号:TP391DOI:10.11925/infotech.2096.3467.2022.1083引用本文:苏明星,吴厚月,李健等.基于多层交互注意力机制的商品属性抽取[J].数据分析与知识发现,2023,7(2):108-118.(SuMingxing,WuHouyue,LiJian,etal.AEMIA:ExtractingCommodityAttributesBasedonMulti-levelInteractiveAttentionMechanism[J].DataAnalysisandKnowledgeDiscovery,2023,7(2):108-118.)1引言商品属性抽取是指从给定的评论文本中抽取出与商品直接相关的属性词,该属性是用户发表评论观点的直接对象[1]。例如,一条有关餐厅的评论语句“这家餐厅的装修真好看,但是价格确实也偏贵一些”,其中“装修”和“价格”是用户发表评论的直接对象,即商品属性抽取的目标。同时,在商品评论文本研究领域中,商品属性抽取也为方面级情感分析、知识图谱和问答系统等任务提供了重要的数据支持。属性抽取任务,目前主流的解决方法是将其转换为机器学习中的序列标注任务(先利用神经网络从大量的标注数据中获取文本的高维度表示,再利用机器学习方法抽取属性词),并在此基础之上,添加额外的文本结构特征,从而进一步提高抽取的准确率。虽然,已有方法通过采用串联的方式将文本结构特征融入文本特征中,提高了抽取的准确率,但未深入考虑串联的特征融合方式无法深层次建模文本结构特征和文本特征,导致模型感知两者间关联性受限,未能充分挖掘出文本结构特征对提升属性抽取任务准确率的...