使用样例数据库——食品销售公司数据库,里面包含17张维表,11张事实表,具体信息如下:维表account:账目表category:类别表currency:货币表customer:客户表days-check:星期表department:部门表employee:员工表position:工厂位置product:商品信息product_class:商品类别promotion:广告region:区域reserve_employee:储备干部表store:分店表time_by_day:时间表warehouse:仓库表warehouse:仓库类表事实表expense_fact:支出表inventory_fact_1997:1997年库存情况inventory_fact_1998:1998年库存情况monthly_rates:每月库存出货比例PCTOwnershipfactrates:出货库存比例salary:薪水表sales_fact_1997:1997销售表sales_fact_1998:1998销售表sales_fact_dec_199:1998.12销售表warehouse_inventory:仓库存货表使用SQLServerBusinessIntelligenceDevelopmentStudio对上述数据建立数据立方体,并进行数据挖掘分析,挖掘的知识类型不限,将挖掘过程和结果形成实验报告。【实验内容】(1)利用给定的数据库,新建一个数据挖掘项目;(2)依次建立数据源,数据源视图,维度,多维度数据集,挖掘机构;(3)选择不同的算法对挖掘的结果进行分析,预测.(4)根据以上分析,提出可以执行的决策【实验步骤】(1)新建一个数据源,我们使用给定的食品加工数据库。(2)根据数据源,建立数据源视图;数据库中各个表的关系如下(部分截图):(3)新建维度,选择time_by_day(4)新建多维数据集之后数据源视图如下(部分):(5)建立数据挖掘结构,选择使用了Microsoft决策树析其中customer表作为事例。选择预测年收入测试数据百分比选择为默认的30%得到如下决策树年收入依赖的数据关系为通过分析例如当条件为:“Education='HighSchoolDegree'andOccupation='Manual'andMemberCard不等于'Normal'”时年收入分布如下当条件为:“Education='BachelorsDegree'andMemberCard='Normal'andNumCarsOwned=0”时年收入分布如下当选择预测值为$30k--$50k时提升图为:拟合分数为0.97拟合较好分类矩阵如下:从图中可以看出$10k--$30预测准确率最高