知识点一分类变量与列联表(一)教材梳理填空1.分类变量我们经常会使用一种特殊的随机变量,以区别不同的或,这类随机变量称为分类变量.现象性质2.列联表(1)定义:列出的两个分类变量的,称为列联表.(2)2×2列联表:一般地,定义一对分类变量X和Y如下:X=0,1和Y=0,1,其样本频数列联表(称为2×2列联表)为:YXY=0Y=1合计X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d频数表[微思考]如何用列联表判定两个分类变量是否有关系?提示:利用列联表中的数据计算,若P(Y=1|X=0)=P(Y=1|X=1),则说明两分类变量无影响,若P(Y=1|X=0)≠P(Y=1|X=1),则说明两分类变量有影响.3.等高堆积条形图(1)等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)如果直接观察等高堆积条形图发现P(Y=1|X=0)与P(Y=1|X=1)相差很大,就可以判断两个分类变量之间有关系.(二)基本知能小试1.判断正误(1)分类变量中的变量与函数中的变量是同一概念.()(2)2×2列联表是借助两个分类变量之间频率大小差异说明两个变量之间是否有关联关系.()答案:(1)×(2)√2.下列关于等高堆积条形图的叙述正确的是()A.从等高堆积条形图中可以精确地判断两个分类变量是否有关系B.从等高堆积条形图中可以看出两个变量频数的相对大小C.从等高堆积条形图中可以粗略地看出两个分类变量是否有关系D.以上说法都不对解析:在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高堆积条形图中仅能够找出频率,无法找出频数.答案:C3.为了解某挑战赛中是否接受挑战与受邀者的性别是否有关系,得到关于分类变量X,Y的列联表如下:挑战性别不接受挑战(Y=0)接受挑战(Y=1)合计男生(X=0)a2173女生(X=1)82533合计b46106则表中a,b处的值分别为________.解析: a+21=73,∴a=52.b=a+8=52+8=60.答案:52,60知识点二独立性检验(一)教材梳理填空1.定义:利用χ2的取值推断分类变量X和Y的方法称为χ2独立性检验,读作“卡方独立性检验”,简称.2.公式:χ2=,其中n=.3.小概率值α的检验规则(1)当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;(2)当χ2