基于互信息最大化和聚类感知的节点表示学习汤乾,武浩**(云南大学信息学院,云南昆明650500)摘要:节点表示学习是研究各类图结构数据的基础.图结构数据具有复杂的结构关系和丰富的节点信息,因此如何融合图结构和节点信息学习高质量的节点表示仍是一个挑战性问题.为此,提出一种基于互信息最大化和聚类感知的节点表示学习模型.首先,对原始图使用图扩散方法构造扩散图;然后,使用图卷积网络编码两个图到低维特征空间获得节点表示和全局表示;最后,基于互信息最大化原理,最大化一个图的节点表示和另一个图的全局表示间的一致性,反之亦然.同时,将语义相似的节点聚类到同一个簇,并最大化两个图的节点表示间的聚类一致性.在两个引文数据集上的节点分类和节点聚类的实验结果表明,该模型的性能在多项指标上都优于基线方法.以Cora数据集为例,在节点分类任务上,该模型对比基线方法在准确率和F1值指标上分别提高了2.7和0.6个百分点.关键词:节点表示学习;互信息;聚类感知;节点分类;节点聚类中图分类号:TP391.1文献标志码:A文章编号:0258−7971(2024)01−0015−08网络作为一种图结构数据,通常被用于反映现实世界中实体间的关系,例如引文网络、蛋白质交互网络和社交网络等.与之相关的研究内容包括图分类[1],节点分类[2],节点聚类[3],社区发现[4],异常检查[5]和边预测[6]等.节点表示学习是分析网络的基础方法,旨在将网络上的节点映射到一个低维、紧凑、连续的潜在空间,并尽可能保留网络有效信息[7].由于图神经网络在融合网络结构和节点特征信息方面的突出能力[8],出现了基于图自编码器的节点表示学习方法.例如图自编码器(graphautoencoder,GAE)和变分图自编码器(variationalautoencoder,VGAE)[9]使用图卷积网络(graphconvolutionalnetwork,GCN)编码网络结构和节点特征到低维向量空间,并通过重建网络结构的方式学习节点表示.对抗式图自编码器(adversariallyregularizedgraphautoencoder,ARGAE)和对抗式变分图自编码器(adversariallyregularizedvariationalgraphautoencoder,ARVGE)[10]使用对抗学习机制学习健壮的节点表示.然而,网络上庞大的节点数量和冗长的节点信息,导致重建每个节点的邻居信息和特征信息的代价是高昂的.近年来,基于互信息最大化原理[11]的图对比学习方法受到越来越多的关注,该类方法可以学习区分性节点表示.例如GCA[12]对原始图增强获得两个不同的增强视图,并投影到低维向量空间最大化两个节点表示的一致性;D...