2023年第5期计算机与数字工程收稿日期:2022年11月12日,修回日期:2022年12月17日基金项目:陕西省教育厅服务地方专项项目(编号:19JC036)资助。作者简介:邓万宇,男,博士,教授,硕士生导师,研究方向:数据挖掘与机器学习。耿美娜,女,硕士研究生,研究方向:数据挖掘与机器学习。李建强,男,硕士研究生,研究方向:计算机视觉与数据挖掘。∗1引言现今,随着信息技术、计算机技术以及互联网技术的迅速发展,获取数据的方式越来越多,人们已经进入了大数据时代。大数据在国内外已经如火如荼的发展起来,在各个领域都在渗透,近年来,人们对于数据信息价值性和可靠性都有着较高的要求,在大数据的时代背景下,每天都会产生各种形式的数据,包括文字、图片、视频以及音频,这些数据优势是规模大、种类多、要求实时性强。在当今大数据时代,同一数据对象往往可以在不同的视图下进行描述,所获取的数据常常可以由多个特征集合进行表示,不同视图下的观测揭示了事物的不同属性,这类数据通常被称为多视图数据[2]。多视图数据的学习主要是在聚类这个背景下被研究,对于此类多视图的研究被称为多视图学不完备多视图的在线反向图正则化聚类∗邓万宇耿美娜李建强(西安邮电大学计算机学院西安710121)摘要在如今的大数据时代,多视图数据引起了越来越多的关注,对多视图聚类的假设是所有视图都是完整的,然而,这种假设在实际应用中很难得到满足。因此不完备多视图聚类是一个重要挑战。针对大规模的不完备多视图数据,考虑到其数据的特征,利用互补性和一致性,论文提出了一种基于非负矩阵分解的在线反向图正则化聚类方法,首先利用加权非负矩阵分解作为基础模型,考虑到缺失实例的影响,引入一个动态权重矩阵;其次,学习所有视图的潜在特征矩阵并得到一个共识矩阵;同时,考虑到挖掘数据的局部结构,在基础模型上增加反向图正则化项;最后,对于大规模的数据,分块处理多视图数据以减少内存需求。在四个真实的数据集上进行了大量实验证明了所提出的方法的有效性。关键词多视图聚类;在线算法;不完备多视图;非负矩阵分解中图分类号TP391DOI:10.3969/j.issn.1672-9722.2023.05.006OnlineReverseGraphRegularizedClusteringforIncompleteMulti-viewDENGWanyuGENGMeinaLIJianqiang(SchoolofComputerScienceandTechnology,Xi'anUniversityofPostandTelecommunications,Xi'an710121)AbstractIntoday'seraofbigdata,multi-viewdatahasattracted...