统计是干什么滴?统计是干什么滴?统计是干什么滴?统计是干什么滴?•用数据说话!问题:120123456151520212326为了检查一颗骰子是否均匀,把这颗骰子掷了次,得结果如下表:出现点数频数问:骰子均匀吗?太乱啦!是哦、似乎看不出什么东东呢!要加工了啦、我都不好意思说你!噢、这样啊……加工、加工、……数据经过加工处理后即得到所谓的“统计量的观测值”!22222221520152020202020202120232026202020204.8赫赫、你动作好快啊!报告老板、数据加工好了、现在可以做什么???????骰子是均匀的!??????嘿嘿、告诉过你啦,好玩吧?统计真好玩!拟合优度检验2120123456151520212326=0.1例:为了检查一颗骰子是否均匀,把这颗骰子掷了次,得结果如下表:出现点数问:骰子均匀吗?频数(试在显著性水平下作拟合优度检验。)20123456111111Pr.666666XXXX如果骰子是均匀的,那么出现各点的次数大致上应该是次左右.设表示骰子掷一次后出现的点数.当骰子均匀时,的概率函数为因此问题转化为问“点数是否服从离散型均匀分布?”(专业说法是:要检验“总体服从上述分布”这个假设,这是一个非参数假设检验问题.)22122211(),()(1)rjjjjriiiiNnpnpNnprnp皮尔逊提出取检验统计量给定显著性水平当时,拒绝原假设.0222222220.91234561515202123261:,1,2,,6620,1,2,,6,0.11520152020202020202120232026204.820202059.2,4.89.2,jHPXjjnpj回到刚才的例子:出现点数频数因为所以不能拒绝原假设,即可以认为骰子是均匀的.独立性检验:例:为了考察某地区50岁以上的成年人吸烟习惯与患肺癌之间的关系,调查了112名对象,得列联表如下:1841278人数患肺癌未患肺癌吸烟不吸烟,试问,在显著性水平1%下,能否认为吸烟习惯与患肺癌无关?02210.9922222211:0.011842212789030821121116.642230228218411211222302282112112903012112ijijijijijHnnnabnnnnnnn原假设:吸烟和患肺癌无关,人数患肺癌未患肺癌吸烟不吸烟2290827811224.8759.1006.0802.22542.289030908211211242.286.64拒绝原假设,即可以认为吸烟和患肺癌有关.