2023-05-10计算机应用,JournalofComputerApplications2023,43(5):1473-1480ISSN1001-9081CODENJYIIDUhttp://www.joca.cn基于长度约束的蝙蝠高效用项集挖掘算法袁泉1,2,唐成亮1,2*,徐雲鹏1,2(1.重庆邮电大学通信与信息工程学院,重庆400065;2.重庆邮电大学通信新技术应用研究中心,重庆400065)(∗通信作者电子邮箱cy.tcl@qq.com)摘要:为了挖掘满足用户特殊需求,如含指定项目数量的高效用项集(HUI),提出一种基于长度约束的蝙蝠高效用项集挖掘算法(HUIM-LC-BA)。该算法融合蝙蝠算法(BA)和长度约束构建高效用项集挖掘(HUIM)模型,首先将数据库转换为位图矩阵,实现高效的效用计算和数据库扫描;其次,采用重新定义的事务加权效用(RTWU)策略缩减搜索空间;最后,对项集进行长度修剪,使用深度优先搜索和轮盘赌注选择法确定修剪项目。在4个数据集的仿真实验中,当最大长度为6时,与HUIM-BA相比,HUIM-LC-BA挖掘的模式数量分别减少了91%、98%、99%与97%,同时运行时间也少于HUIM-BA;且在不同长度约束条件下,与FHM+(FasterHigh-utilityitemsetMingplus)算法相比运行时间更稳定。实验结果表明,HUIM-LC-BA能有效挖掘具有长度约束的HUI,并减少挖掘模式的数量。关键词:高效用项集挖掘;蝙蝠算法;长度约束;位图矩阵;轮盘赌注选择法中图分类号:TP301.6文献标志码:ABatalgorithmforhighutilityitemsetminingbasedonlengthconstraintYUANQuan1,2,TANGChengliang1,2*,XUYunpeng1,2(1.SchoolofCommunicationandInformationEngineering,ChongqingUniversityofPostsandTelecommunications,Chongqing400065,China;2.ResearchCenterofNewCommunicationTechnologyApplications,ChongqingUniversityofPostsandTelecommunications,Chongqing400065,China)Abstract:InordertominetheHighUtilityItemsets(HUIs)thatmeetthespecialneedsofusers,suchasthespecifiednumberofitems,aBatAlgorithmforHighUtilityItemsetMiningbasedonLengthConstraint(HUIM-LC-BA)wasproposed.BycombiningtheBatAlgorithm(BA)andlengthconstraints,anewHighUtilityItemsetMining(HUIM)modelwasconstructed,inwhichthedatabasewastransformedintoabitmapmatrixtorealizeefficientutilitycalculationanddatabasescanning.ThenthesearchspacewasreducedbyusingtheRedefinedTransactionWeightedUtility(RTWU)strategy.Finally,theleng...