第八章成对数据的统计分析人教A版2019必修第三册8.3.1分类变量与列联表1.了解探究分类变量之间关系的方法2.制作、理解2×2列联表,用频率分析法、图形分析法探究两个分类变量之间的关系3.能够对统计数据进行简单整理、初步分析提升数学抽象、数据建模及数据分析素养学习目标饮用水的质量是人类普遍关心的问题,根据统计,饮用优质水的518人中,身体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人.问题人的身体健康状况与饮用水的质量之间有关系吗?提示我们可以根据2×2列联表找到人的身体健康与饮用水之间的关系,也就是本节课所要学习的内容.情境引入•变量数值变量分类变量什么是分类变量?分类变量与数值变量之间的区别是什么?•变量数值变量分类变量例:人的身高;100米短跑所用时间;产品月销量数值变量的取值为实数.其大小和运算都有实际含义.两个数值变量之间的关系:回归分析法;由一个变量的变化去推测另一个变量的变化例:班级;性别;是否经常锻炼;是否每年体检分类变量的取值可以用实数来表示;这些数值只作为编号使用,用来表示不同的类别;并没有通常的大小和运算意义例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示如何判断两个分类变量之间是否具有关联性呢?年龄与是否每年体检之间是否有关呢?性别在体育锻炼的经常性方面是否存在差异呢?•方法1——由频率估计概率结论:该校的女生和男生在体育锻炼的经常性方面存在差异,男生更经常锻炼。性别在体育锻炼的经常性方面是否存在差异呢?•方法2——借助条件概率性别锻炼总计不经常(Y=0)经常(Y=1)女生(X=0)192331523男生(X=1)128473601总计3208041124结论:该校的女生和男生在体育锻炼的经常性方面存在差异,男生更经常锻炼。性别在体育锻炼的经常性方面是否存在差异呢?•方法3——借助等高堆积条形图性别锻炼总计不经常(Y=0)经常(Y=1)女生(X=0)192331523男生(X=1)128473601总计3208041124女生男生0%20%40%60%80%100%经常性别在体育锻炼的经常性方面是否存在差异呢?2.列联表在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存.我们将形如下表这种形式的数据统计表称为2×2列联表.2×2列联表给出了成对分类变量数据的交叉分类频数.组别甲(Y=0)乙(Y=1)合计A(X=0)aba+bB(X=1)cdc+d合计a+cb+da+b+c+d用Ω表示两所学校的全体学生构成的集合,则Ω为样本...