独立性检验的基本思想及其初步应用高二年级数学主讲人胡丹天津市第七中学某地方法院判定某烟草公司向一位女士赔偿236亿美元.因为这位女士的丈夫,长期抽烟,最终36岁就因肺癌死亡.法院是依据什么对这个案件进行的判决呢?身高温度考试成绩性别兴趣商品质量等级结合以往我们学习统计的经验,对于吸烟与患肺癌这个具体案例,首先要进行数据搜集,根据这个问题的特点,我们都需要搜集哪些数据呢?由吸烟与患肺癌这两个分类变量的取值特征,我们需要得到吸烟的样本人数,患肺癌的样本人数,吸烟且患肺癌的样本人数,吸烟且没有患肺癌的样本人数,不吸烟且患肺癌的样本人数,不吸烟且不患肺癌的样本人数等.探究问题一对于分类变量的样本数据,根据以往处理统计数据的经验,我们要如何用表格进行整理呢?为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965那么,吸烟是否对患肺癌有影响呢?依据两个分类变量的取值,列出的频数分布表我们称为2×2列联表列分类(Y)合计未发生数(y1)发生数(y2)行分类(X)甲(x1)aba+b乙(x2)cdc+d合计a+cb+da+b+c+d为研究吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965在不吸烟样本中,患肺癌的有在吸烟样本中,患肺癌的有吸烟群体和不吸烟群体患肺癌的可能性存在差异420.54%.7817492.28%.2148等高条形图与表格相比,图形更能直观的反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.不患肺癌患肺癌总计不吸烟1吸烟177757817≈99.46%20992148≈97.72%427817≈0.54%492148≈2.28%通过计算样本频率以及观察等高条形图,我们得到直观判断是“吸烟与患肺癌有关”,那么这种判断是否可靠呢?也就是,当把这组样本数据的分析结果放到总体中时,我们有多大的把握判断“吸烟与患肺癌有关”呢?在利用回归分析研究定量变量时,我们通过最小二乘法构建了回归直线方程的系数公式,又通过构建残差这个统计量分析样本对总体的拟合效果.探究问题二类比回归分析,在研究吸烟是否对患肺癌有影响这个问题时,我们同样需要考虑,利用样本数据构建一个什么样的统计量来刻画总体的情况?我们假设吸烟与患肺癌之间没有关系(即吸烟与患肺癌之间是相互独立的),...