研发应用产业创新研究2023.6第12期118基金项目:榆林市科技计划项目“基于多模态数据语义检索的关键技术研究”(项目编号:CXY-2022-95)。作者简介:杜鹏举,男,陕西榆林人,博士研究生在读,副教授;研究方向:应用语言学。基于多模态数据语义检索的关键技术研究杜鹏举(榆林学院外国语学院,陕西榆林719000)摘要:多模态数据的语义检索指利用多模态数据对不同模态之间的相似性进行度量和排序,最终以满足用户需求为目标的检索过程。多模态数据的语义检索技术是近年来计算机科学和信息科学的研究热点之一。随着互联网技术的快速发展,大数据成为互联网最重要的特征之一,如何在海量、动态复杂的多模态数据中快速地找到用户感兴趣、有价值的信息是一个非常重要和有挑战性的课题。本文主要研究了多模态数据语义检索过程中可能存在的问题和相应解决方案,并对基于这些问题和解决方案所涉及的关键技术进行了详细描述。关键词:多模态数据;语义检索;关键技术一、引言近年来,随着互联网技术的发展,我们生活中已经离不开各种不同的终端设备,手机、电脑、平板等各种电子设备已经成为我们工作和生活中不可或缺的工具,这些电子设备可以帮助我们在工作与生活中节省很多的时间,提升效率。但是随之而来的问题就是这些设备越来越多,各种各样的数据越来越庞大,人们也变得越来越忙碌了。为了更好地管理各种设备上产生的海量数据并方便检索与查询,人们逐渐提出了语义检索技术,多模态智慧搜索可以为用户提供更为便捷化的体验和更加优质有效的服务内容。二、多模态数据分析中面临的问题(一)维数灾难随着计算机的飞速发展,数据分析成为一门科学,并广泛应用于各个领域。但是在大数据时代下,如果我们在分析数据的时候只考虑单一的数据,而忽略了对于数据之间关联对数据的影响,那么这些多模态数据所反映出的规律就有可能是错误的,这也是如今很多数据挖掘工作者经常遇到的问题。例如,通过一个样本来推断另一个样本就有可能出现偏差,因此在做多模态数据挖掘时要想更好地获取高质量的知识并不容易,我们要想获得高质量模型就必须进行维灾管理。维灾管理(FaultManagement)指针对某一特定场景或事件对相关信息流实时控制和管理,以保证其在特定场景或者事件发生时能够正常工作,在进行多模态数据挖掘中所需要做的维灾管理就是为了防止数据异常情况发生而进行的一种维护工作[1]。文本作为多模态数据存在的广泛的数据形式,文本作为一种非结构化的数据...