基于最大平均差异的迁移模糊C均值聚类焦连猛*王丰潘泉(西北工业大学自动化学院西安710072)摘要:该文针对迁移聚类问题,提出一种基于最大平均差异的迁移模糊C均值(TFCM-MMD)聚类算法。TFCM-MMD解决了迁移模糊C均值聚类算法在源域与目标域数据分布差异大的情况下迁移学习效果减弱的问题。该算法基于最大平均差异准则度量域间差异,通过学习源域和目标域的投影矩阵,以减小源域和目标域数据在公共子空间分布的差异,进而提升迁移学习的效果。最后,通过基于合成数据集和医学图像分割数据集的实验,进一步验证了TFCM-MMD算法在解决域间差异大的迁移聚类问题上的有效性。关键词:迁移学习;模糊聚类;最大平均差异中图分类号:TN911.7;TP391.4文献标识码:A文章编号:1009-5896(2023)06-2216-10DOI:10.11999/JEIT220645TransferFuzzyC-MeansClusteringBasedonMaximumMeanDiscrepancyJIAOLianmengWANGFengPANQuan(SchoolofAutomation,NorthwesternPolytechnicalUniversity,Xi’an710072,China)Abstract:Inthispaper,aTransferFuzzyC-MeansclusteringalgorithmbasedonMaximumMeanDiscrepancy(TFCM-MMD)isproposed.TFCM-MMDsolvestheproblemthatthetransferlearningeffectofthetransferfuzzyc-meansclusteringalgorithmisweakenedwhenthedatadistributionbetweensourcedomainandtargetdomainisverydifferent.Thealgorithmmeasuresinter-domaindifferencesbasedonthemaximummeandiscrepancycriterion,andreducesthedifferencesofdatadistributionbetweensourcedomainandtargetdomaininthecommonsubspacebylearningtheprojectionmatrixofsourcedomainandtargetdomain,soastoimprovetheeffectoftransferlearning.Finally,experimentsbasedonsyntheticdatasetsandmedicalimagesegmentationdatasetsfurtherverifytheeffectivenessofTFCM-MMDalgorithminsolvingtransferclusteringproblemswithlargeinter-domaindifferences.Keywords:Transferlearning;Fuzzyclustering;MaximumMeanDiscrepancy(MMD)1引言聚类就是对数据样本进行分组,使得同一组中的样本相对相似,而不同组中的样本相对不同。在过去的几十年里,已经提出了许多聚类算法,如模糊C均值聚类[1,2]、谱聚类[3,4]、最大熵聚类[5,6]等。聚类技术已经在许多工程领域得到了广泛的应用,例如故障检测[7]、图像分割[8]等。但目前许多聚类算法只有在有足够高质量样本的前提下才能产生良好的聚类结果。但在实...