《独立性检验的基本思想及其初步应用(1)》学习任务单【学习目标】(1)回顾回归分析的基本思想及应用步骤,获得研究数值变量相关关系的一般思路,并尝试将此应用于分类变量相关性的研究中。(2)在案例“吸烟是否与患肺癌有关系”的探究过程中,了解列联表、等高条形图、独立性检验三种方法在刻画“两个分类变量是否有关系”时各自的特点。体会独立性检验的基本思想,明确独立性检验的基本步骤。(3)能够判断两个分类变量是否有关系。【课前准备】1、上网查阅:什么是数值变量?举两个数值变量的例子什么是分类变量?举两个分类变量的例子2、用反正法证明命题“三角形的三个内角中,至少有一个内角不大于600”请补全下列过程。证明:假设原命题不成立,即中,600,600,600。则1800,这与=1800矛盾。所以假设不成立,原命题。【课上活动】问题探究:为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:问题:吸烟否得对患肺癌与有影响?1、通过列联表初步感知像上表这样列出的两个分类变量的频数表,称为。计算:在不吸烟者样本中,患肺癌的频率为≈;在吸烟样本中,患肺癌的频率为≈;结论:吸烟群体和不吸烟群体患肺癌的可能性;。2、通过等高条形图直观判断根据图形可得结论:吸烟群体和不吸烟群体患肺癌的可能性。不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计987491996513、独立性检验准确判断统计学家在长期的探索和研究中,创立了这样一个表格:0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.845.0246.6357.87910.83说明:第一行为根据实际问题的需要,容许推断“两个分类变量有关系”犯错误概率的上界。第二行为随机变量的判断标准,即与“犯错概率的上界”对应的“临界值”。将吸烟与患肺癌列联表中的数字用字母代替,得到用字母表示的列联表:为判断:吸烟与患肺癌有关先假设0H:“吸烟与患肺癌关系”构造随机变量22()()()()()nadbcKabcdacbd若0H成立,则的值应该若容许犯错误概率的上界为0.01,根据表格,确定了的临界值又根据吸烟与患肺癌列联表得的观测值远大于6.635,与假设因此假设0H则原判断:“吸烟与患肺癌有关”即在犯错误的概率不超过0.01的条件下,我们有的把握认为“吸烟与患肺癌有关系”。4、独立性检验理论与反证法做比较基本思想类似:都是先假设结论,然后根据是否能推出“矛盾”来断定结论是否成立。矛盾的含义有区别:反正法在推导目标...