第40卷第2期2023年6月长江工程职业技术学院学报JournalofChangjiangInstituteofTechnologyVol.40No.2Jun.2023最小支持度挖掘算法在高校学生成绩关联规则的应用柯红香(漳州科技职业学院,福建漳浦363202)摘要:以漳州科技职业学院市场营销专业152名学生47门课程的成绩信息作为研究数据,根据课程成绩分布规律,利用标准差划分等级进行成绩离散化处理,针对传统关联规则Apriori算法单一的最小支持度的局限性,提出了一种自适应多最小支持度关联规则算法,采用统计拟合方法实现最小支持度和最小置信度的自适应取值,并将置信度和提升度相结合的模式筛选出有价值的规则,从而得到市场营销专业不同课程的关联性,为创新人才培养改革提供参考。关键词:数据挖掘;关联规则;学生成绩中图分类号:TP312DOI:10.14079/j.cnki.cn42-1745/tv.2023.02.016文献标识码:A文章编号:1673-0496(2023)02-0069-05关联规则挖掘是一种基于频繁项集算法的数据挖掘技术,其目的是在海量的、看似不相关的数据中,通过关联分析,挖掘多个变量之间的相关性,这些关联规则能够为决策的调整和优化提供有效的参考依据。以漳州科技职业学院市场营销专业152名学生47门课程的成绩信息作为研究对象,分析传统关联规则Apriori算法中单支持度的局限性,提出基于最大值控制的多最小支持度关联规则改进算法,从而得到市场营销专业不同课程的关联性规则,为完善人才培养改革提供参考。1关联规则算法1.1关联规则挖掘技术假设L={Li,L2,L.Ln}是N个不同事务项的项集,关联规则是一个X→Y的表达式,X和Y是集合L的真子集且XnY=0。关联规则的属性可以描述为3个参数:支持度(support)、置信度(confidence)和频繁项集["。(1)支持度是指项集L中同时具备X和Y特征的事务数占总事务数的百分比,其中min_sup表示最小支持度。支持度越大,表示X和Y同时出现的频率越高,表示X和Y之间的联系大,反之联系小。(2)置信度是指项集L中包含XUY的事务占收稿日期:2022-12-13基金项目:漳州科技职业学院科研课题“基于关联性规则的学生就业数据研究”(项目编号:ZK202006)作者简介:柯红香(1986-),女,福建漳浦人,副教授,硕士,研究方向:现代信息技术、网络安全。X的事务的比例,其中,min_conf表示最小置信度。置信度越大,表明X出现时Y出现的概率越大,即X对Y的指向性越强,当置信度达到100%,表示X出现Y一定出现。其中,表示数据集的支持度计数,N表示总事务数。sup(X-Y)=g(XUY)conf(X→Y)=a(XUY)(X...