信息通信基于话语主题的对话文本摘要刘东奇,王宏生(沈阳工业大学信息科学与工程学院,辽宁沈阳110870)摘要:对话文本摘要任务是从一段拥有两位及以上参与者之间的交流话语中提炼出精简的内容,以便他人可快速了解对话的全过程。相对于传统的新闻式文本,对话文本通常具有结构复杂、信息来源混乱等难点。因此,传统的文本摘要模型并不能适配对话文本的结构,无法生成高质量的摘要内容。为此,文章提出了一种针对对话文本结构所改进的摘要生成方法,通过解析对话文本中的话语、说话人、话语主题三个元素,构建对话结构图。使用微调的Bi-LSTM对对话结构图中的节点以词为单位编码,通过基于Transformer模型的异构图编码器对对话结构图进行图级编码,使用带有注意力机制和指针网络的解码器实现摘要内容的生成。主要解决对话文本摘要中出现的信息来源混乱和人称指代错误问题。实验结果显示,本文的模型在生成摘要的质量上有一定提高。关键词:对话文本;对话结构;文本摘要;异构图编码中图分类号:TP393(SchoolofInformationScienceandEngineering,ShenyangUniversityofTechnology,Shenyang110870,Liaoning)Abstract:Thetaskofdialoguetextsummaryistoextractconcisecontentfromaconversationbetweentwoormoreparticipants,sothatotherscanquicklyunderstandthewholeprocessofdialogue.Comparedwithtraditionalnewstext,dialoguetextusuallyhasdifficultiessuchascomplexstructureandconfusionofinformationsources.Therefore,thetraditionaltextsummarymodelcannotadapttothestructureofthedialoguetextandcannotgeneratehigh-qualitysummarycontent.Tothisend,thispaperpro-posesanimprovedsummarygenerationmethodforthestructureofthedialoguetext,whichconstructsthedialoguestructurediagrambyanalyzingthethreeelementsofthediscourse,thespeakerandthediscoursethemeinthedialoguetext.Thefine-tun-edBi-LSTMisusedtoencodethenodesinthedialogstructurediagramintermsofwords,theheterogeneousgraphencoderbasedontheTransformermodelisusedtoencodethedialogstructurediagramatthegraphlevel,andthedecoderwithattentionmechanismandpointernetworkisusedtogeneratethesummarycontent.Itmainlysolvestheproblemsofconfusionofinfor-mationsourcesandpersonalreferenceerrorsinthedialoguetextsummary.Theexperimentalresultsshowthatthemod...