第35卷第3期重庆邮电大学学报(自然科学版)Vol.35No.32023年6月JournalofChongqingUniversityofPostsandTelecommunications(NaturalScienceEdition)Jun.2023DOI:10.3979/j.issn.1673 ̄825X.202112150433融合多路注意力机制的语句匹配模型收稿日期:2021 ̄12 ̄15修订日期:2023 ̄03 ̄03通讯作者:王进wangjin@cqupt.edu.cn基金项目:国家重点研发计划专项(SQ2021YFE010559)FoundationItem:TheNationalKeyResearchandDevelopmentProgram(SQ2021YFE010559)王进ꎬ刘麒麟ꎬ马樱仪ꎬ孙开伟ꎬ胡珂(重庆邮电大学数据工程与可视计算重庆市重点实验室ꎬ重庆400065)摘要:为了增强语句内关键信息和语句间交互信息的表征能力ꎬ有效整合匹配特征ꎬ提出一种融合多路注意力机制的语句匹配模型ꎮ采用双向长短时记忆网络获取文本的编码信息ꎬ通过自注意力机制学习语句内部的关键信息ꎻ将编码信息和自注意力信息拼接之后ꎬ通过多路注意力机制学习语句间的交互信息ꎻ结合并压缩多路注意力层之前和之后的信息ꎬ通过双向长短时记忆网络进行池化获得最终的语句特征ꎬ经过全连接层完成语句匹配ꎮ实验结果表明ꎬ该模型在SNLI和MultiNLI数据集上进行的自然语言推理任务、在QuoraQuestionPairs数据集上进行的释义识别任务和在SQuAD数据集上进行的问答语句选择任务中均表现出了更好效果ꎬ能够有效提升语句匹配的性能ꎮ关键词:语句匹配ꎻ注意力机制ꎻBi ̄LSTMꎻ深度学习中图分类号:TP391文献标志码:A文章编号:1673 ̄825X(2023)03 ̄0520 ̄08Sentencematchingmodelfusedwithmulti ̄channelattentionmechanismWANGJinꎬLIUQilinꎬMAYingyiꎬSUNKaiweiꎬHUKe(KeyLaboratoryofDataEngineeringandVisualComputingꎬChongqingUniversityofPostsandTelecommunicationsꎬChongqing400065ꎬP.R.China)Abstra...