2023-05-10计算机应用,JournalofComputerApplications2023,43(5):1430-1437ISSN1001-9081CODENJYIIDUhttp://www.joca.cn基于槽位相关信息提取的对话状态追踪模型石利锋,倪郑威*(浙江工商大学信息与电子工程学院,杭州310018)(∗通信作者电子邮箱zhengwei.ni@zigsu.edu.cn)摘要:对话状态追踪(DST)是任务型对话系统中一个重要的模块,但现有的基于开放词表的DST模型没有充分利用槽位的相关信息以及数据集本身的结构信息。针对上述问题,提出基于槽位相关信息提取的DST模型SCEL-DST(SCEandLOWforDialogueStateTracking)。首先,构建槽位相关信息提取器(SCE),利用注意力机制学习槽位之间的相关信息;然后,在训练过程中应用学习最优样本权重(LOW)策略,在未大幅增加训练时间的前提下,加强模型对数据集信息的利用;最后,优化模型细节,搭建完整的SCEL-DST模型。实验结果表明,SCE和LOW对SCEL-DST模型性能的提升至关重要,该模型在两个实验数据集上均取得了更高的联合目标准确率,其中在MultiWOZ2.3(Wizard-of-OZ2.3)数据集上与相同条件下的TripPy(TriplecoPy)相比提升了1.6个百分点,在WOZ2.0(Wizard-of-OZ2.0)数据集上与AG-DST(AmendableGenerationforDialogueStateTracking)相比提升了2.0个百分点。关键词:对话状态追踪;注意力机制;任务型对话;课程学习;预训练模型中图分类号:TP183文献标志码:ADialoguestatetrackingmodelbasedonslotcorrelationinformationextractionSHILifeng,NIZhengwei*(SchoolofInformationandElectronicEngineering,ZhejiangGongshangUniversity,HangzhouZhejiang310018,China)Abstract:DialogueStateTracking(DST)isanimportantmoduleintask-orienteddialoguesystems,buttheexistingopen-vocabulary-basedDSTmodelsdonotmakefulluseoftheslotcorrelationinformationaswellasthestructuralinformationofthedatasetitself.Tosolvetheaboveproblems,anewDSTmodelnamedSCEL-DST(SCEandLOWforDialogueStateTracking)wasproposedbasedonslotcorrelationinformationextraction.Firstly,aSlotCorrelationExtractor(SCE)wasconstructed,andtheattentionmechanismwasusedtolearnthecorrelationinformationbetweenslots.ThentheLearningOptimalsampleWeights(LOW)strategywasappliedinthetrainingprocesstoenhancethemodel'sutilizationofthedatasetinformationwithoutsubstantialinc...