模糊最小二乘孪生支持向量机聚类朱娇,陈素根*(安庆师范大学数理学院,安徽安庆246133)摘要:孪生支持向量机聚类是一种新的基于平面的聚类方法,但其没有考虑样本数据分布对聚类性能的影响。为了解决这个问题,本文基于样本分布信息构造了一种模糊隶属度,在此基础上提出了模糊最小二乘孪生支持向量机聚类算法。该算法通过引入模糊隶属度函数,并对每个样本点赋予不同的权重,可以改进聚类性能。在人工数据集和UCI数据集上进行实验,并与K-means、KPPC、TWSVC和LSTWSVC算法进行比较,实验结果说明了本文算法的有效性。关键词:聚类分析;孪生支持向量机;最小二乘孪生支持向量机;模糊隶属度中图分类号:TP391文献标志码:A文章编号:1007-4260(2023)01-0065-07FuzzyLeastSquaresTwinSupportVectorClusteringZHUJiao,CHENSugen*(SchoolofMathematicsandPhysics,AnqingNormalUniversity,Anqing246133,China)Abstract:Twinsupportvectorclusteringisanewplane-basedmethod,butitdoesnotconsidertheeffectofsampledatadistributiononclusteringperformance.Inordertoaddressthisproblem,weconstructafuzzymembershipbasedondatadistri-butioninformationandproposeafuzzyleastsquarestwinsupportvectorclusteringalgorithm.Thealgorithmcanimproveclus-teringperformancebyintroducingafuzzymembershipandassigningdifferentweighttoeachdatasample.ExperimentsareconductedonsomeartificialdatasetsandUCIdatasets,comparedwithK-means,KPPC,TWSVCandLSTWSVC,theexperi-mentalresultsshowtheeffectivenessofourproposedalgorithm.Keywords:clusteringanalysis;twinsupportvectormachine;leastsquarestwinsupportvectormachine;fuzzymembership聚类问题是模式识别和机器学习领域的常见问题之一,在许多方面都得到了广泛研究和成功应用[1-2]。它是按照某种特定标准把一个数据集分成不同的类或簇,并使得同一簇的样本相似性尽可能大,同时不同簇样本间的差异性也尽可能大。常用的聚类分析方法有基于划分方法、基于层次方法和基于密度方法等。传统的基于划分聚类方法如K-means聚类,是根据样本的K个聚类中心点并通过一个特定标准把样本划分到K个簇中。当样本点呈线性分布时,用聚类中心平面代替聚类中心点的思想,Brad-ley等[3]提出了K平面聚类(K-planeclustering,KPC),并开启了基于平面聚类的新思路。KPC通过最小化每个点到最近聚类平面距离的平...