第59卷第1期2023年1月南京大学学报(自然科学)(NATURALSCIENCE)Vol.59,No.1Jan.,2023JOURNALOFNANJINGUNIVERSITY基于相关性约束矩阵分解的多标签分类方法田小瑜1,2,秦永彬1,2*,黄瑞章1,2,陈艳平1,2(1.公共大数据国家重点实验室,贵州大学,贵阳,550025;2.贵州大学计算机科学与技术学院,贵阳,550025)摘要:多标签分类是一项重要且具有挑战性的任务,对于场景分类、信息检索和网页挖掘等领域有重要意义.近年来,研究者倾向于挖掘并利用标签相关性以及实例相关性来提升多标签分类的性能,其中利用这类相关性来解决多标签分类中的标签缺失问题一直是机器学习领域的热门研究点,但现有的方法都忽略了标签和实例之间的相关性.针对标签完整和标签缺失的情况,基于矩阵分解的方式分解得到实例和标签的特征表示矩阵,在利用标签相关性和实例相关性建立正则约束的同时,首次建立实例和标签特征表示间的相关性并用以建立正则约束,进而提升算法性能.在三个真实数据集上对提出的算法进行性能验证,实验结果表明,该算法和对比算法相比,获得了最高的预测精度.关键词:标签相关性,实例相关性,标签与实例相关性,矩阵分解,多标签分类中图分类号:TP391文献标志码:AMulti⁃labelclassificationmethodbasedoncorrelation⁃constrainedmatrixfactorizationTianXiaoyu1,2,QinYongbin1,2*,HuangRuizhang1,2,ChenYanping1,2(1.StateKeyLaboratoryofPublicBigData,GuizhouUniversity,Guiyang,550025,China;2.TheCollegeofComputerScienceandTechnology,GuizhouUniversity,Guiyang,550025,China)Abstract:Multi⁃labelclassificationisachallengingclassificationtask,whichisimportantinthefieldsofsceneclassification,informationretrieval,andwebmining.Recently,researcherstendtomineanduselabelcorrelationandinstancecorrelationtoimprovetheperformanceofmulti⁃labelclassification.Usingsuchcorrelationtosolvetheproblemofmissinglabelsinmulti⁃labelclassificationhasbeenaresearchhotspot,butexistingmethodsignorethecorrelationbetweenlabelsandinstances.Inthispaper,aimingatthesituationofcompletelabelsandmissinglabels,thefeaturerepresentationmatrixofinstanceandlabelsisobtainedbasedonmatrixfactorization.Whileusinglabelcorrelationandinstancecorrelationtoestablishconstraints,thecorrelationbetweeninst...