2023-05-10计算机应用,JournalofComputerApplications2023,43(5):1481-1488ISSN1001-9081CODENJYIIDUhttp://www.joca.cn基于Seeds集和成对约束的半监督三支聚类集成姜春茂1,吴鹏2,李志聪2*(1.福建工程学院计算机科学与数学学院,福州350118;2.哈尔滨师范大学计算机科学与信息工程学院,哈尔滨150025)(∗通信作者电子邮箱lizhicong72@163.com)摘要:聚类集成使用合适的策略融合多个具有差异性的基聚类成员,能够有效提高聚类结果的稳定性、鲁棒性和准确率。当前聚类集成的研究较少利用已知的先验信息,面对复杂数据时难以刻画对象与类簇之间明确的归属关系。因此,提出一种基于Seeds集和成对约束的半监督三支聚类集成方法。首先,基于已有的标签信息提出一种新的三支标签传播算法构造基聚类成员;其次,提出一种半监督三支聚类集成框架集成基聚类成员,构造出一致性相似矩阵,并利用成对约束信息对该矩阵进行优化调整;最后,将三支谱聚类作为一致性函数对相似矩阵进行聚类,得到最终集成结果。在多个UCI真实数据集上的实验结果表明,与基于类簇的相似分区算法(CSPA)、超图分区算法(HGPA)、元类簇算法(MCLA)、标签传播算法(LPA)、Cop-Kmeans等半监督聚类集成算法相比,所提方法的归一化互信息(NMI)、调整兰德系数(ARI)和F测度在绝大多数据集上取得了最优值,获得了相对更好的聚类集成结果。关键词:三支决策;聚类集成;三支聚类;成对约束;半监督;Seeds集中图分类号:TP391文献标志码:ASemi-supervisedthree-wayclusteringensemblebasedonSeedssetandpairwiseconstraintsJIANGChunmao1,WUPeng2,LIZhicong2*(1.SchoolofComputerScienceandMathematics,FujianUniversityofTechnology,FuzhouFujian350118,China;2.CollegeofComputerScienceandInformationEngineering,HarbinNormalUniversity,HarbinHeilongjiang150025,China)Abstract:Usingappropriatestrategies,clusteringensemblecaneffectivelyimprovethestability,robustnessandprecisionofclusteringresultsbyfusingmultiplebaseclustermemberswithdifferences.Currentresearchontheclusteringensemblerarelyusesknownprioriinformation,anditisdifficulttodescribebelongingrelationshipsbetweenobjectsandclusterswhenfacingcomplexdata.Therefore,asemi-supervisedthree-wayclusteringensemblemethodwasproposedonthebasisofSeedssetandpairwiseconst...