信息记录材料2023年7月第24卷第7期计算机软件技术在大数据时代应用探究江诗敏(湖北闪云信息科技有限公司湖北武汉430070)【摘要】大数据技术的出现改变了当前计算机软件技术的应用水平,扩大了应用范围,提高了应用质量,大数据正逐步成为一种高价值的资源。对大数据进行深度挖掘,不仅能够有效地提升社会服务水平,还能够为一些政策的制定提供一定依据。为厘清大数据技术对计算机软件技术应用的价值,进一步促进信息技术的发展,通过文献查阅、实地调研并结合相关研究对计算机软件中的数据挖掘技术进行探究,为计算机软件在大数据背景下更好地应用提供一些方向。【关键词】计算机软件技术;大数据时代;数据挖掘【中图分类号】TP39【文献标识码】A【文章编号】1009-5624(2023)07-0191-040引言大数据时代,互联网已经进入了以光网为载体的“宽带视频”时代,在4G及5G的支持下,移动互联网及物联网等应用正蓬勃发展。数据互动已从小范围文本和图片简单的传输发展为照片、音乐和视频等信息共享,而且视频的内容也在以几何倍数增长。将其中某些数据整合分析,产生出有价值的数据,对海量数据进行存储和传输,都会产生大量的数据挖掘、智能计算等方面的需求。尤其是在数据挖掘技术方面,被广泛地运用于计算机软件工程,并且取得了良好成果。本文在此基础上,阐述了数据挖掘技术的内涵及其在软件工程中的重要作用。1数据挖掘概念数据挖掘是一种新兴的技术,其最大的作用在于数据分析,能够通过处理海量的数据并获取有用的信息,提高数据的利用率。因此,将数据挖掘技术应用于软件工程,能够保证数据的质量与效率,更好地发挥数据的价值。因此,越来越多行业将数据挖掘技术应用于后端数据的处理过程,分析出供需关系,更好地服务社会。2数据挖掘的目标数据挖掘工作主要包括:分类、预测、关联、聚类、回归、智能推荐等几方面。企业、政府等组织与实际需求以及业务内容相结合,运用挖掘技术从现有的数据中提取有价值的信息,为自身的发展带来竞争力。数据挖掘的任务如图1所示。图1数据挖掘的目标3数据挖掘的方法目前,国内外对数据挖掘的研究主要集中在五个方面,即分类和预测、聚类、关联规则、时序模式、离群点检测。3.1分类和预测针对已知类型的数据集构建模型,然后用该模型对其他的样本进行再分类,此模型具有监督学习、精度较高的特点。预测指的是利用已有数据集训练模型,通过模型预测未知样本的数据性能,它是探索2个或2个以上变量之间相互依赖的模型。贝叶斯网络、回归分析、人工神经网络...