电子商务数据分析基础模块三数据分类与处理CONTENT目录单元一认识数据分类与处理单元二分类统计单元三数据处理单元四数据计算单元三数据处理单元三数据处理一、数据清洗数据清洗是指将数据表中多余、重复的数据筛选出来并删除,将缺失、不完整的数据补充完整,将内容、格式错误的数据纠正或剔除的操作行为。数据清洗是对数据进行重新审查和校验的过程,目的在于提升数据的质量,确保数据的准确性、完整性和一致性。缺失值清洗格式内容清洗逻辑错误清洗重复数据清洗无价值数据清洗单元三数据处理缺失值清洗数据集中某个或某些属性的值是不完整的。缺失值产生的原因有些信息无法获取,如在收集顾客婚姻状况和工作信息时,未婚人士的配偶、未成年儿童的工作单位等都是无法获取的信息。数据收集或者保存失败造成数据缺失,如数据存储的失败、存储器损坏、机械故障等。人为原因导致的某些信息被遗漏或删除了。单元三数据处理空值清洗打开原始数据表格,选中数据区域,在“开始”选项卡下的“编辑”功能组中单击“查找和选择”按钮,点击“定位条件”命令,在弹出的“定位条件”对话框中,选中“空值”,点击“确定”后,所有的空值即可被一次性选中。1单元三数据处理定位到空白值后,可以选择“数据补齐”、“删除记录”或者“不处理”。如需数据补齐,则直接输入需要补充的内容,按“Ctrl+Enter”快捷键,进行批量填充。2单元三数据处理错误标识符清洗######DIV/0!单元格中的数据超出了该单元格的宽度,或者单元格中的日期时间公式产生了一个负值进行公式运算时,除数使用了数值零、指向了空单元格或包含零值单元格的引用#VALUE!键入公式的方式错误,或者引用的单元格错误单元三数据处理将鼠标定位在出现“I12”单元格中,在公式编辑栏中,修改原公式“=H12/E12”为“=IFERROR(H12/E12,"/")”1单元三数据处理确认输入后,“I12”单元格中的“#VALUE!”被修改为“/”,然后拖动“I12”单元格的填充柄,将其他发生错误的单元格进行填充修改2单元三数据处理格式内容清洗由于系统导出渠道或人为输入习惯的原因,整合而来的原始数据往往不能做到格式统一,内容上也容易出现空格。“订单创建时间”列出现了四种不同的表达方式,“物流公司”列的字符前面或中间存在空格,需要将其修正。单元三数据处理选中“订单创建时间”整列,右键打开弹出式菜单,点击“设置单元格格式”选项,在弹出的“设置单元格格式”对话框中,选择“数字”选项卡,点击“日期”将其类...