第49卷第2期2023年2月ComputerEngineering计算机工程基于重建误差的任务型对话未知意图检测毕然1,2,3,王轶1,3,周喜1,3(1.中国科学院新疆理化技术研究所,乌鲁木齐830011;2.中国科学院大学,北京100049;3.新疆民族语音语言信息处理实验室,乌鲁木齐830011)摘要:现有未知意图检测模型通常将语句映射到向量空间,并使用局部异常因子算法定义密度较小的特征点为未知意图,但经交叉熵损失训练的已知意图特征簇更加狭长,簇内的整体间距、密度和分散情况不均匀,进而增加了检测难度。针对上述问题,提出一种基于自动编码器重建误差的未知意图检测模型。在训练阶段,使用融入标签知识的联合损失函数训练已知意图分类器,使已知意图特征类间距离大且类内距离小,并利用这些特征训练一个仅能获取已知意图信息的自动编码器。在测试阶段,利用自动编码器将重建误差较大的样本视为未知意图,其余样本视为已知意图正常分类。在SNIPS数据集上的实验结果表明,在已知意图占比为25%、50%、75%时,该模型的MacroF1得分相比于表现最优的增强语义的高斯混合损失基线模型分别提升了16.93%、1.14%和2.37%,能够检测到更多的未知意图样本,同时在类别分布极不平衡的ATIS数据集上也有较好的性能表现。关键词:意图识别;任务型对话;未知意图检测;损失函数;自动编码器;重建误差开放科学(资源服务)标志码(OSID):中文引用格式:毕然,王轶,周喜.基于重建误差的任务型对话未知意图检测[J].计算机工程,2023,49(2):54-60.英文引用格式:BIR,WANGY,ZHOUX.Unknownintentdetectionfortask-orienteddialogsbasedonreconstructionerror[J].ComputerEngineering,2023,49(2):54-60.UnknownIntentDetectionforTask-OrientedDialogsBasedonReconstructionErrorBIRan1,2,3,WANGYi1,3,ZHOUXi1,3(1.XinjiangTechnicalInstituteofPhysicsandChemistry,ChineseAcademyofSciences,Urumqi830011,China;2.UniversityofChineseAcademyofSciences,Beijing100049,China;3.XinjiangLaboratoryofMinoritySpeechandLanguageInformationProcessing,Urumqi830011,China)【Abstract】ExistingunknownintentdetectionmodelsmaputterancestothevectorspaceandusetheLocalOutlierFactor(LOF)algorithmtodefinethefeaturepointswithlowdensityastheunknownintent.However,knownintentfeatureclusterstrainedbythecross-entropylossarenarrowerandlong...