独立性检验高二年级数学北京市中小学空中课堂主讲人张怡北京师范大学附属中学我们已经知道,事件A与事件B独立的充要条件是()()()PABPAPB()()()PABPAPB利用这一点,我们可以通过概率的计算来判断两个事件是否独立.然而,如果要判断现实生活中两个随机事件是否独立,并不是一件容易的事.情境与问题任意抽取某市的一名学生,记A:喜欢长跑,B:是女生.(1)你能得出P(A),P(B),P(AB)这三者的准确值吗?问题中的P(A),P(B),P(AB)准确值的确定,是比较难的,甚至是不可能的.然而,利用频率估计概率,通过抽样调查获得样本数据后,就可以得到上述三个值的近似值.情境与问题任意抽取某市的一名学生,记A:喜欢长跑,B:是女生.(1)你能得出P(A),P(B),P(AB)这三者的准确值吗?(2)如果要判断A与B是否独立,该怎么办?从概率学的角度,受随机性的影响,我们很难直接利用概率公式P(AB)=P(A)P(B)进行估计.情境与问题任意抽取某市的一名学生,记A:喜欢长跑,B:是女生.(1)你能得出P(A),P(B),P(AB)这三者的准确值吗?(2)如果要判断A与B是否独立,该怎么办?如何判断生活中两个分类变量之间是否独立,或如何对两个分类变量进行独立性检验,是我们生活中经常遇到的一大类问题。假设:通过调查,我们获取了下述数据:抽查了110人,其中女生有50人;且这110人中,喜欢长跑的有60人,其中女生有20人.为了方便起见,请同学们把数据整理成表格形式.喜欢长跑不喜欢长跑总计女203050男402060总计6050110喜欢长跑不喜欢长跑总计女203050男402060总计6050110因为这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为2×2列联表.喜欢长跑不喜欢长跑总计女203050男402060总计6050110由2×2列联表可知:606;11011505;11011喜欢长跑的概率P(A)可以估计为是女生的概率P(B)可以估计为喜欢长跑且是女生的概率P(AB)可以估计为202.11011尝试与发现同学们,此时可以利用是否成立来判断A与B是否独立吗?()()()PABPAPB答案是否定的.追问:为什么?因为P(A),P(B),P(AB)都是根据样本数据得到的估计值,而估计值是有误差的,因此直接用是否成立来判断A与B是否独立是不合理的.但是,如果A与B独立,那么P(A)P(B)应该可以作为P(AB)的近似值.这是从统计意义上做出的合理推断.即尽管随机性会对数据的准确性带来影响,但理论上,如果A与B是独立的,则这种影响也一定不会太大.这是独立性检验的基本思想.需要说明的是:如果,则,,.()()()PABPAPB()()()PA...