原创精品资源学科网独家享有版权,侵权必究!学科网(北京)股份有限公司8.3列联表与独立性检验(基础知识+基本题型)知识点一列联表与等高条形图1.列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量和,它们的取值分别为和,其样本频数列联表(也称为列联表)为:总计总计2.等高条形图:将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图.图就是一个等高条形图,其中两个浅色条的高分别表示不吸烟和吸烟样本中不患肺癌的频率;两个深色条的高分别表示不吸烟和吸烟样本中患肺癌的频率.提示⑴等高条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显(即和相差很大),就判断两个分类变量之间有关系.⑵列联表与等高条形图的关系与特点:它们都可以用来分析分类变量之间是否有关系,但等高条形图能更直观地反映出两个分类变量是否相互影响.知识点二独立性检验为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量,其中为样本容量.原创精品资源学科网独家享有版权,侵权必究!学科网(北京)股份有限公司要判断“两个分类变量有关系”,首先假设该结论不成立,即“:两个分类变量没有关系”成立.在该假设下我们所构造的随机变量应该很小.若由观测数据计算得到的的观测值很大,则断言不成立,即认为“两个分类变量有关系”;若观测值很小,则说明在样本数据中没有发现足够证据拒绝.上面这种利用随机变量来判断“两个分类变量有关系”的方法称为独立性检验.提示独立性检验与反证法的比较反证法独立性检验要证明结论要确认“两个分类变量有关系”在不成立的前提下进行推理假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下计算推出矛盾意味着结论成立若由观测数据计算得到的的观测值很大,则在一定可信程度上说明假设不合理没有找到矛盾,不能对下任何结论,即反证法不成立根据随机变量的含义,可以通过概率()的大小来评价该假设不合理的程度有多大,从而得出“两个分类变量有关系”这一结论成立的可信程度有多大知识点三独立性检验的具体应用一般地,假设有两个分类变量和,它们的取值分别为和,其样本频数列联表为:总计总计若要推断的论述为:“与有关系”.⑴根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查临界值表确定临界值.附...