分享
22 胡丹 天津市第七中学 独立性检验的基本思想及其初步应用(1).ppt
下载文档

ID:3450406

大小:1.95MB

页数:31页

格式:PPT

时间:2024-05-08

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
22 胡丹 天津市第七中学 独立性检验的基本思想及其初步应用1 天津市 第七 中学 独立性 检验 基本 思想 及其 初步 应用
独立性检验的基本思想及其初步应用,高二年级 数 学,主讲人 胡 丹,天津市第七中学,某地方法院判定某烟草公司向一位女士赔偿236亿美元.因为这位女士的丈夫,长期抽烟,最终36岁就因肺癌死亡.法院是依据什么对这个案件进行的判决呢?,身高,温度,考试成绩,性别,兴 趣,商品质量等级,结合以往我们学习统计的经验,对于吸烟与患肺癌这个具体案例,首先要进行数据搜集,根据这个问题的特点,我们都需要搜集哪些数据呢?由吸烟与患肺癌这两个分类变量的取值特征,我们需要得到吸烟的样本人数,患肺癌的样本人数,吸烟且患肺癌的样本人数,吸烟且没有患肺癌的样本人数,不吸烟且患肺癌的样本人数,不吸烟且不患肺癌的样本人数等.,对于分类变量的样本数据,根据以往处理统计数据的经验,我们要如何用表格进行整理呢?,为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9 965人,得到如下结果(单位:人),那么,吸烟是否对患肺癌有影响呢?,依据两个分类变量的取值,列出的频数分布表我们称为22列联表,为研究吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9 965人,得到如下结果(单位:人),在不吸烟样本中,患肺癌的有,在吸烟样本中,患肺癌的有,吸烟群体和不吸烟群体患肺癌的可能性存在差异.,等高条形图与表格相比,图形更能直观的反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.,通过计算样本频率以及观察等高条形图,我们得到直观判断是“吸烟与患肺癌有关”,那么这种判断是否可靠呢?也就是,当把这组样本数据的分析结果放到总体中时,我们有多大的把握判断“吸烟与患肺癌有关”呢?在利用回归分析研究定量变量时,我们通过最小二乘法构建了回归直线方程的系数公式,又通过构建残差这个统计量分析样本对总体的拟合效果.,类比回归分析,在研究吸烟是否对患肺癌有影响这个问题时,我们同样需要考虑,利用样本数据构建一个什么样的统计量来刻画总体的情况?,我们假设吸烟与患肺癌之间没有关系(即吸烟与患肺癌之间是相互独立的),且用事件A表示不吸烟,事件B表示不患肺癌.,|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;|ad-bc|越大,说明吸烟与患肺癌之间关系越强.,为了能够更清楚的说明,我们将列联表中的数据抽象为字母,以表示随机样本中的频数.并假设H0:吸烟与患肺癌之间没有关系(即吸烟与患肺癌相互独立).,成立,化简得,在H0成立的条件下应该有,分析至此,可能你会提出这样的问题:1.只考虑不吸烟且不患肺癌的情况,不考虑其他情况,可以吗?2.怎样衡量越大与越小,有没有一个量 化的标准?,数学界被誉为统计学之父的英国数学家卡尔皮尔逊(Karl Pearson),也遇到了这些问题,怎么解决呢?,解决了样本可以估计总体了,而且这个统计量可以通过每个随机样本的数据计算出具体的值.最后我们就要解决如何利用这个值进行推断?,通过前面对|ad-bc|的分析,我们知道,如果H0:吸烟与患肺癌之间没有关系成立,那么K2的取值应该很小,通过样本数据求得的K2观测值k可以推断什么呢?,根据这个值如何推断“吸烟与患肺癌有关”?,据此我们可以根据K2观测值k 56.632对这个问题给出推断:在犯错误的概率不超过 0.01 的前提下认为“吸烟与患肺癌有关系”.,思考,若取k0=10.828,你会对这个问题给出推断吗?,在犯错误的概率不超过 0.001 的前提下认为“吸烟与患肺癌有关系”.,k 56.632,用随机变量 K2的观测值k来判断“两个分类变量有关系”的方法称为两个分类变量的独立性检验.,小结:回顾我们分析“吸烟对患肺癌是否有影响”这个案例的过程:我们是如何判断两个分类变量是否有关系?1.提出假设H0:两个分类变量没有关系;2.写出22列联表,并由K2的公式计算其观测值k;3.作出推断:确定临界值k0,通过观测值k与k0比较作出判断;,(1)若kk0,认为k很大,推断H0不成立,从而有1-P(K2k0)100%的把握认为“两个分类变量有关系”,即:在犯错误的概率不超过P(K2k0)的前提下认为“两个分类变量有关系”;(2)若kk0,认为k很小,无法拒绝H0,即:样本观测数据没有足够证据证明“两个分类变量有关系”.,反证法原理与独立性检验原理有哪些异同?,直观判断与独立性检验有什么异同?,直观判断,直观判断与独立性检验有什么异同?,【例】在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.(1)利用图形判断秃顶与患心脏病是否有关系;(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?,解:根据已知的数据得到如下的列联表:,秃顶与患心脏病列联表,算出秃顶和不秃顶样本中患心脏病的频率分别 和,(1)直观判断:,因此,在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系.,(2)独立性检验:,根据列联表的数据,可得:,对这个问题的结论我们需要注意以下两点:1.结论适用的范围:这个问题的这组数据来源于被调查的医院,因此这个结论只适合被调查医院的住院病人群体;2.犯错误概率的含义:犯错误的概率不超过0.01,是指把“秃顶与患心脏病没有关系”错误的推断为“秃顶与患心脏病有关系”的概率不超过0.01.,【课堂小结】,独立性检验的基本思想及其应用,直观判断,课 堂 练 习,1为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有效果的图形是(),A,B,C,D,D,A,课 后 作 业,【题目】通过随机询问72名不同性别的大学生在购买食物时 是否看营养说明,得到如下列联表:,能否在犯错误的概率不超过0.005的前提下认为性别和是否看营养说明有关系呢?,人教A版选修2-3 P97第二题,谢谢大家!同学们再见,

此文档下载收益归作者所有

下载文档
收起
展开