53Feb.20242024年2月Vol.50No.信息化研究InformatizationResearch期第50卷第基于深度学习的藏文讽刺对话识别研究尖羊措1.2.3,安见才让1,2.3(1.青海民族大学计算机学院,西宁,810007;2.青海省藏文信息处理与机器翻译重点实验室,西宁,810007;3.省部共建藏语智能信息处理及应用国家重点实验室,西宁,810007)摘要:针对情感分类研究中讽刺表达检测困难,还未有学者对藏文讽刺识别展开研究的问题,本文创建了藏文讽刺对话数据集,并借助提示学习方法在预训练模型微调方面的优势,采用BERT和提示学习(Prompt)对藏文讽刺对话进行识别。实验结果表明,本文所提出的方法优于基于BERT的句子级讽刺数据集(无上下文信息)上的结果,并验证了该方法的可行性,望对未来的藏文讽刺识别任务提供有效借鉴。关键词:讽刺识别;藏文;情感分类;提示学习中图分类号:TP391.10引言随着互联网的快速普及和网民数量迅速增加,人们通常会在抖音、快手、微信公众号等平台发表自已的观点和诉求,由此产生了大量的文本信息,这些信息中包含着人们对事物所持有的情感态度,如积极情感和消极情感。情感分析是指从人们发表的言论中提取情感或者观点,其研究逐渐从粗粒度情感分析到细粒度情感分析。文本细粒度情感分析从不同层次粒度可以分为篇章级情感分析、句子级情感分析及方面级情感分析[2]。目前,细粒度情感分析的最新任务有方面级情感分析三元祖抽取、多粒度情感分析、隐式情感分析及情感依赖关系抽取等。但讽刺识别、语义消歧等仍是情感分析领域中需要解决的难点[21。讽刺是指人们用比喻、夸张等手法对人或社会事件收稿日期:2023-11-29基金项目:省部共建藏语智能信息处理及应用国家重点实验室、青海省藏文信息处理与机器翻译重点实验室开放课题(No.2021-Z-001);青海民族大学研究生创新项目(No.09M2022004)进行揭露、批评。讽刺语言表达的复杂性往往会导致情感极性的反转,影响模型对情感分析性能[3]尤其是其中存在的一些隐含信息很难被挖掘出来,这将影响情绪挖掘和决策的判断。所以,进行讽刺识别研究是很有必要且是情感分析领域中函待解决的问题。目前,中英文的情感分析和讽刺识别方面硕果累累。但是,藏语作为小语种存在适用范围小、掌握人数较少、数据难以采集等问题,讽刺识别工作仍存在许多不足,有较大的提升空间。1相关研究随着情感分析领域的不断扩展,讽刺识别成为了自然语言处理的热点问题之一。根据使用的方法不同,本文分别对近3年的中英文...