8.3列联表与独立性检验最新课标(1)通过实例,理解2×2列联表的统计意义.(2)通过实例,了解2×2列联表独立性检验及其应用.[教材要点]要点一分类变量与列联表1.分类变量:区别不同的现象或性质的随机变量称为分类变量.状元随笔1.分类变量的取值一定是离散的.2.分类变量是大量存在的,如是否吸烟,商品的等级等.2.2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为y1y2合计x1aba+bx2cdc+d合计a+cb+da+b+c+d状元随笔(1)列联表是两个或两个以上分类变量的汇总统计表,现阶段我们仅研究两个分类变量的列联表,并且每个分类变量只取两个值,这样的列联表称为2×2列联表.(2)列联表有助于直观地观测数据之间的关系,如a表示既满足x1,又满足y1的样本量,aa+b表示在x1情况下,又满足y1条件的样本所占的频率.要点二独立性检验1.定义:利用χ2的取值推断分类变量X和Y是否独立性的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.2.公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).3.临界值:忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立,称xα为α的临界值.这个临界值就可作为判断χ2大小的标准.常用临界值表如下:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828状元随笔列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体,即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释,比如:χ2≥10.828,就认为有99.9%以上的把握认为“两个分类变量有关系”,或者说在犯错误的概率不超过0.1%的前提下,可以认为“两个分类变量有关系”.通常认为χ2≤2.706时,样本数据中没有充分的证据支持结论“两个分类变量有关系”.[基础自测]1.判断正误(正确的画“√”,错误的画“×”)(1)列联表中的数据是两个分类变量的频数.()(2)事件A与B的独立性检验无关,即两个事件互不影响.()(3)χ2的大小是判断事件A与B是否相关的统计量.()(4)独立性检验的方法和数学上的反证法是一样的.()√×√×2.如表是一个2×2...