第29卷第1期2024年1月doi:10.13682/j.issn.2095-6533.2024.01.012西安邮电大学学报JOURNALOFXI'ANUNIVERSITYOFPOSTSANDTELECOMMUNICATIONS一种基于EFD的混合属性聚类算法Vol.29No.1Jan.2024王文庆12,向孜瑞1,2(1.西安邮电大学自动化学院,陕西西安710121;2.物联网应用技术联合示范实验室,陕西西安710121)摘要:为了提高混合属性聚类效率,提出一种基于扩张翻转距离(ExpandFlipDistance,EFD)的混合属性聚类算法。以信息及嫡权法为基础,通过定义扩张属性和属性扩张量得到EFD,将其作为待聚类对象属性区分的依据,进行聚类对象的属性约简,最终对约简后的属性构建混合属性聚类模型,实现混合属性聚类。实验结果表明,所提算法获得的聚类谱系图和聚类结果均优于对比算法,验证了该算法的合理性和有效性。关键词:混合属性聚类;扩张属性;属性扩张量;扩张翻转距离;属性差异化中图分类号:TP181ClusteringalgorithmformixedattributebasedonEFD(1.SchoolofAutomation,Xi'anUniversityofPostsandTelecommunications,Xi'an710121,China;2.InternetofThingsApplicationTechnologyJointDemonstrationLaboratory,Xi'an710121,China)Abstract:Inordertoimprovetheclusteringefficiencyofmixedattributes,amixed-attributecluste-ringalgorithmbasedontheexpandflipdistance(EFD)isproposed.Basedontheinformationentro-pyandentropyweightmethod,theEFDisobtainedbydefiningtheexpansionattributeandtheat-tributeexpansionamount,whichisusedasthebasisfortheattributedifferentiationoftheobjecttobeclustered,andtheattributereductionoftheclusteredobjectiscarriedout,andfinallythemixedattributeclusteringmodelisconstructedforthereducedattributetorealizethemixedattributeclus-tering.Experimentresultsshowthattheclusteringpedigreemapandtheclusteringresultsobtainedbytheproposedalgorithmarebetterthanthoseofthecomparisonalgorithms,whichverifiesitsra-tionalityandeffectiveness.Keywords:mixedattributeclustering;expansionproperties;theamountofattributeexpansion;ex-pandflipdistant;attributedifferentiation随着数据获取的便捷化,混合属性数据不断增加1。聚类分析作为数据研究领域的基本技术,可从复杂数据中提取有价值的信息,被广泛应用于数据挖掘和数据聚类的研究中[2}混合属性数据聚类问题主要包括聚类融合算法的...