电子商务数据分析基础模块三数据分类与处理CONTENT目录单元一认识数据分类与处理单元二分类统计单元三数据处理单元四数据计算单元三数据处理引导案例某电器官方旗舰店于2022年8月份参加了一期聚划算活动,因折扣力度大,推广效果极好。活动结束后,该企业将后台销售数据导出,交给数据分析部门,进行此次活动的效果追踪评价。数据分析师拿到数据经过整理后,发现该源数据存在如图所示的质量问题。引导案例为了保证数据分析结果的准确性,数据分析师先对该源数据进行了处理,修正了错误数据,统一了日期格式,处理了缺失内容,又将混杂在一起的数据分开,为之后的数据计算和数据分析做好了准备。结合案例,思考并回答以下问题:(1)在图3-22中,处理完成后的数据是怎样的?(2)在电商运营中,除了案例中存在的数据质量问题,还需要进行哪些问题的数据处理?单元三数据处理一、数据清洗数据清洗是指将数据表中多余、重复的数据筛选出来并删除,将缺失、不完整的数据补充完整,将内容、格式错误的数据纠正或剔除的操作行为。数据清洗是对数据进行重新审查和校验的过程,目的在于提升数据的质量,确保数据的准确性、完整性和一致性。缺失值清洗格式内容清洗逻辑错误清洗重复数据清洗无价值数据清洗单元三数据处理缺失值清洗数据集中某个或某些属性的值是不完整的。缺失值产生的原因有些信息无法获取,如在收集顾客婚姻状况和工作信息时,未婚人士的配偶、未成年儿童的工作单位等都是无法获取的信息。数据收集或者保存失败造成数据缺失,如数据存储的失败、存储器损坏、机械故障等。人为原因导致的某些信息被遗漏或删除。单元三数据处理空值清洗打开原始数据表格,选中数据区域,在“开始”选项卡下的“编辑”功能组中单击“查找和选择”按钮,点击“定位条件”命令,在弹出的“定位条件”对话框中选中“空值”,点击“确定”后,所有的空值即可被一次性选中。1单元三数据处理定位到空白值后,可以选择“数据补齐”、“删除记录”或者“不处理”。如需数据补齐,则直接输入需要补充的内容,按“Ctrl+Enter”组合键,进行批量填充。2单元三数据处理知识链接处理缺失值的三种方法:(1)数据补齐。即使用某个统计指标填充缺失数据,如该变量的样本平均值等。(2)删除记录。将有缺失值的记录删掉,但这样会导致样本量减少,数据量较少时应谨慎使用。(3)不处理。样本较少时,或者该数据缺失属正常情况时,不做处理。单元三数据处理错误标识符清洗######DIV/0!...