第59卷第1期2023年1月南京大学学报(自然科学)(NATURALSCIENCE)Vol.59,No.1Jan.,2023JOURNALOFNANJINGUNIVERSITY基于组标签的多标签流特征选择算法张展云1,罗川1*,李天瑞2,李红梅2,刘盾3(1.四川大学计算机学院,成都,610065;2.西南交通大学计算机与人工智能学院,成都,611756;3.西南交通大学经济管理学院,成都,610031)摘要:流标签是当前多标签学习领域中一个较新颖的挑战性问题,存在标签空间未定、标签数量不断增加甚至趋于无穷等问题.在多标签学习的特征选择中,每当有新的标签到达时标签空间都将发生改变,传统的多标签特征选择算法需重新进行特征选择,所以不适用.针对此问题,采用将流标签进行分组批量处理的方式,并考虑标签之间的相关性,提出一种新的流式多标签特征选择方法,考虑分组后每组标签内部潜在的关联结构和不同标签组之间的标签差异性,赋予每组标签不同的权重来计算每个特征与标签空间的模糊互信息.同时,结合mRMR(Max⁃RelevanceandMin⁃Redundancy)的特征选择策略进行冗余特征的剔除,从而挑选最优的特征子集.该方法同时适用于固定标签空间和流式标签空间中的特征选择问题.最后,选取八个多标签基准数据集,采用四种评价指标与已有相关的多标签特征选择方法进行对比实验,实验结果证明了提出方法的有效性和高效性.关键词:多标签学习,特征选择,标签分组,流标签,互信息中图分类号:TP391文献标志码:AMulti⁃labelstreamingfeatureselectionbasedongrouplabelsZhangZhanyun1,LuoChuan1*,LiTianrui2,ChenHongmei2,LiuDun3(1.CollegeofComputerScience,SichuanUniversity,Chengdu,610065,China;2.SchoolofComputingandArtificialIntelligence,SouthwestJiaotongUniversity,Chengdu,611756,China;3.SchoolofEconomicsandManagement,SouthwestJiaotongUniversity,Chengdu,610031,China)Abstract:Streaminglabelsarecurrentlyarelativelynewchallengeformulti⁃labellearning,whichmeansthatthelabelspaceisuncertain,thatis,thenumberoflabelsisconstantlyincreasing,andeventendstobeinfinity.Intheproblemofmulti⁃labelfeatureselection,becausethelabelspacechangeswheneveranewlabelarrives,traditionalmulti⁃labelfeatureselectionalgorithmsneedtore⁃selectthefeature,soitisnotapplicable.Aimingatthisproblem,thispaperproposesanovelstreamingmulti⁃labelfeatureselectionme...