第八章成对数据的统计分析8.3列联表与独立性检验8.3.1分类变量与列联表人教2019A版选择性必修第三册布吉高级中学刘文丽情景导入吸烟是否会增加患肺癌的风险?吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低人们的生活质量、缩短人类寿命的紧迫问题.为此,联合国固定每年5月31日为全球戒烟日.数值变量:是说明事物数字特征的一个名称,其取值是数值型数据.其大小和运算都有实际意义,如人的身高、树的胸径、树的高度等.分类变量:是说明事物类别的一个名称,其取值是分类数据。如“性别”就是一个分类变量,其变量值为“男”或“女”;“行业”也是一个分类变量,其变量值可以为“零售业”、“旅游业”、“汽车制造业”等.概念解析1问题探究1问题1.为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查,全校学生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼.你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?为了清楚起见,我们用表格整理数据性别锻炼合计不经常(Y=0)经常(Y=1)女生(X=0)192331523男生(X=1)128473601合计3208041124我们将上表这种形式的数据统计表称为2×2列联表(contingencytable).概念解析2性别锻炼合计不经常(Y=0)经常(Y=1)女生(X=0)192331523男生(X=1)128473601合计3208041124例1.为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀,试分析两校学生中数学成绩优秀率之间是否存在差异.学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788典例解析学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788两个分类变量之间关联关系的定性分析的方法:课堂小结问题2:你认为“两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的?有可能问题探究2独立性检验1.下面是一个2×2列联表:则表中a,b分别等于.y1y2总计x1a2173x282533总计b46a=52,b=60应用探究2.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到右面列联表:分别...