分享
9zg3o11.2(1).pptx
下载文档

ID:3448234

大小:3.60MB

页数:47页

格式:PPTX

时间:2024-05-07

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
zg3o11
第二节变量间的相关关系、统计案例,必备知识基础落实,关键能力考点突破,最新考纲1会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).3了解独立性检验的思想、方法,并能初步应用独立性检验的思想方法解决一些简单的实际问题4通过典型案例了解回归分析的思想方法,并能初步应用回归分析的思想、方法解决一些简单的实际问题,考向预测考情分析:两个变量线性相关的判断及应用,回归直线方程的求法及应用,利用22列联表判断两个变量的相关关系将是高考考查的热点,题型将是选择与填空题或者在解答题中综合考查学科素养:通过线性回归分析及独立性检验的应用考查数学建模、数据分析、数学运算的核心素养,必备知识基础落实,一、必记3个知识点1变量间的相关关系常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系2两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关,(3)回归方程为 x,其中=1=2 2,.(4)相关系数当r0时,表明两个变量正相关;当r0时,表明两个变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性,3独立性检验(1)22列联表:假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称22列联表)为:(2)K2统计量K2()2(ab)(cd)(ac)(bd)(其中nabcd为样本容量).,二、必明3个常用结论1求解回归方程的关键是确定回归系数,应充分利用回归直线过样本中心点(,).2根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有关的把握越大3根据回归方程计算的 值,仅是一个预报值,不是真实发生的值,三、必练4类基础题(一)判断正误1判断下列说法是否正确(请在括号中打“”或“”).(1)散点图是判断两个变量是否相关的一种重要方法和手段()(2)回归直线方程 x 至少经过点(x1,y1),(x2,y2),(xn,yn)中的一个点()(3)若事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越小()(4)两个变量的相关系数的绝对值越接近于1,它们的相关性越强(),(二)教材改编2必修3P90例题改编某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如表:则y对x的线性回归直线方程为()A 2.3x0.7 B 2.3x0.7C 0.7x2.3 D 0.7x2.3,答案:C,解析:易求 x 9,y 4,样本点的中心(9,4)代入验证,满足 y 0.7x2.3.,3选修23P86例2改编两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A模型1的相关指数R2为0.98B模型2的相关指数R2为0.80C模型3的相关指数R2为0.50D模型4的相关指数R2为0.25,答案:A,解析:在两个变量y与x的回归模型中,它们的相关指数R2越接近1,拟合效果越好,在四个选项中A的相关指数最大,所以拟合效果最好的是模型1.,(三)易错易混4(回归方程的概念不清)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为 0.85x85.71,则下列结论中不正确的是_(填序号)y与x具有正的线性相关关系;回归直线过样本点的中心(,);若该大学某女生身高增加1 cm,则其体重约增加0.85 kg;若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.,解析:由于回归直线的斜率为正值,故y与x具有正的线性相关关系,选项中的结论正确;回归直线过样本点的中心,选项中的结论正确;根据回归直线斜率的意义易知选项中的结论正确;由于回归分析得出的是估计值,故选项中的结论不正确,5(忽视回归直线方程过样本点中心)在一次考试中,5名学生的数学和物理成绩如下表(已知学生的数学和物理成绩具有线性相关关系):现已知其线性回归方程为 0.36x,则根据此线性回归方程估计数学得90分的同学的物理成绩为_分(四舍五入取整数),73,解析:x 60+65+70+75+80 5 70,y 62+64+66+68+70 5 66,所以660.3670 a,得 a 40.8,即线性回归方程为 y 0.36x40.8.当x90时,y 0.369040.873.273(分),(四)走进高考62020全国卷某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i1,2,20)得到下面的散点图:由此散点图,在10 至40 之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()Ayabx Byabx2 Cyabex Dyab ln x,答案:D,解析:观察散点图可知,散点图用光滑曲线连接起来比较接近对数型函数的图象,关键能力考点突破,考点一相关关系的判断1对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图如图,对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图如图.由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关,答案:C,解析:由散点图可得两组数据均线性相关,且图的线性回归方程斜率为负,图的线性回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关,2某公司在2019年上半年的月收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:根据统计资料,则()A月收入的中位数是15,x与y有正线性相关关系B.月收入的中位数是17,x与y有负线性相关关系C月收入的中位数是16,x与y有正线性相关关系D月收入的中位数是16,x与y有负线性相关关系,答案:C,解析:月收入的中位数是 15+17 2 16,收入增加,支出增加,故x与y有正线性相关关系,3四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且 2.347x6.423;y与x负相关且 3.476x5.648;y与x正相关且 5.437x8.493;y与x正相关且 4.326x4.578.其中一定不正确的结论的序号是()A BC D,答案:D,解析:正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为.,反思感悟)判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关(2)相关系数:r0时,正相关;r0时,正相关;0时,负相关.,考点二回归分析角度1线性回归方程及其应用例1某手机厂商在销售200万台某型号手机时开展“手机碎屏险”活动活动规则如下:用户购买该型号手机时可选购“手机碎屏险”,保费为x元若在购机后一年内发生碎屏可免费更换一次屏幕该手机厂商将在这200万台该型号手机全部销售完毕一年后,在购买碎屏险且购机后一年内未发生碎屏的用户中随机抽取1 000名,每名用户赠送1 000元的红包为了合理确定保费x的值,该手机厂商进行了问卷调查,统计后得到下表(其中y表示保费为x元时愿意购买该“手机碎屏险”的用户比例):,(1)根据上面的数据求出y关于x的回归直线方程;(2)通过大数据分析,在使用该型号手机的用户中,购机后一年内发生碎屏的比例为0.5%.已知更换一次该型号手机屏幕的费用为800元,若该手机厂商要求在这次活动中因销售该“手机碎屏险”产生的利润不少于70万元,能否把保费x定为5元?参考数据:表中x的5个值从左到右分别记为x1,x2,x3,x4,x5,相应的y值分别记为y1,y2,y3,y4,y5,,解析:(1)由 x 30,y 0.4,i=1 5(x)(y)19.2,i=1 5(x)2 1 000,得 b i=1 5(x)(y)i=1 5(x)2=-0.019 2,=y-b x=0.976,所以y关于x的回归直线方程为=-0.019 2x+0.976.(2)能把保费x定为5元理由如下:若保费x定为5元,则估计y=-0.019 25+0.976=0.88,估计该手机厂商在这次活动中因销售该“手机碎屏险”产生的利润为2 000 0000.885-2 000 0000.880.5%800-1 0001 000=0.76 10 6(元)=76(万元)70(万元),所以能把保费x定为5元,(反思感悟)求线性回归方程的基本步骤(1)先把数据制成表,从表中计算出,1 2 2 2 2,x1y1x2y2xnyn的值;(2)计算回归系数,;(3)写出线性回归方程,角度2相关系数及其应用例22020全国卷某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i1,2,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,,(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i1,2,20)的相关系数(精确到0.01);,解析:(1)由已知得样本平均数 y=1 20 i=1 20=60,从而该地区这种野生动物数量的估计值为60200=12000(2)样本(,)(i=1,2,20)的相关系数,(3)根据现有统计资料,各地块间植物覆盖面积差异很大为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由,解析:(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计,反思感悟)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.,角度3非线性回归方程例3某购物商场分别推出支付宝和微信“扫码支付”购物活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用“扫码支付”现统计了活动刚推出一周内每天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次,统计数据如下表所示:,(1)根据散点图判断,在推广期内,扫码支付的人次y关于活动推出天数x的回归方程适合用ycdx来表示,求出该回归方程,并预测活动推出第8天使用扫码支付的人次;,解析:(1)由y=cdx,两边同时取常用对数得:lg y=lg(cdx)=lg c+lg dx;设lg y=v,v=lg c+lg dx,把样本中心点(4,1.52)代入vlg clg dx,得:lg c 0.52,v 0.520.25x,lg y 0.520.25xy关于x的回归方程为:y 100.520.25x100.52100.25x3.31(100.25)x;把x8代入上式,y 3.31102331;活动推出第8天使用扫码支付的人次为331;,(2)推广期结束后,商场对顾客的支付方式进行统计,结果如下表:商场规定:使用现金支付的顾客无优惠,使用会员卡支付的顾客享受8折优惠,扫码支付的顾客随机优惠,根据统计结果得知,使用扫码支付的顾客,享受7折优惠的概率为 1 6,享受8折优惠的概率为 1 3,享受9折优惠的概率为 1 2.现有一名顾客购买了a元的商品,根据所给数据用事件发生的频率来估计相应事件发生的概率,估计该顾客支付的平均费用是多少?,解析:(2)记一名顾客购物支付的费用为,则的取值可能为:a,0.9a,0.8a,0.7a;P(a)0.2;P(0.9a)0.3 1 2 0.15;P(0.8a)0.50.3 1 3 0.6;P(0.7a)0.3 1 6 0.05.分布列为:所以,一名顾客购物的平均费用为:02a0.9a0.150.8a0.60.7a0.050.85a(元),反思感悟回归分析问题的类型及解题方法(1)求回归方程根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关利用公式,求出回归系数 待定系数法:利用回归直线过样本点的中心求系数(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值(3)利用回归直线判断正、负相关,决定正相关还是负相关的是系数(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.,【对点训练】1已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下表对应数据,根据表中数据可得回归方程 x 其中 11据此估计,当投入6万元广告费时,销售额约为()A.60万元 B63万元C65万元 D69万元,答案:B,解析:由表格数据可知 x 1+2+3+4+5 5 3,y 10+15+30+45+50 5 30,因为回归方程过点(x,y),所以303 b+a,且 b 11,得 a 3,所以 y 11x3,代入x6,得 y 63.,2某公司为研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值,(1)根据散点图判断:yabx与yc 哪一个模型更适合作为该图书每册的成本费y与印刷数量x的回归方程?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(结果精确到0.01);(3)若该图书每册的定价为9.22元,则至少应该印刷多少册才能使销售利润不低于80 000元?(假设能够全部售出,结果精确到1)附:对于一组数据(1,v1),(2,v2),(n,vn),其回归直线 的斜率和截距的最小二乘估计分别为=1()()=1()2,=-,解析:(1)由散点图判断,yc d x 更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程(2)令u 1 x,先建立y关于u的线性回归方程,由于 d 7.049 0.787 8.9578.96,所以 c y d u 3.638.9570.2691.22,所以y关于u的线性回归方程为 y 1.228.96u,所以y关于x的回归方程为 y 1.22 8.96 x.(3)假设印刷x千册,依题意得9.22x 1.22+8.96 x x80,解得x11.12,所以至少印刷11 120册才能使销售利润不低于80 000元,考点三独立性检验应用性、创新性 例42021全国甲卷甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:,(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:K2 n(adbc)2(ab)(cd)(ac)(bd),,解析:(1)根据题表中数据知,甲机床生产的产品中一级品的频率是 150 200 0.75,乙机床生产的产品中一级品的频率是 120 200 0.6.(2)根据题表中的数据可得K2 400 1508012050 2 200200270130 400 39 10.256.因为10.2566.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异,2022湖南长沙模拟为了解某校学生参加社区服务的情况,采用按性别分层抽样的方法进行调查,已知该校共有学生960人,其中男生560人,从全校学生中抽取了容量为n的样本,得到一周参加社区服务时间的统计数据如表所示(1)求m,n的值;(2)能否有95%的把握认为该校学生一周参加社区服务时间是否超过1小时与性别有关?附:,K2 n(adbc)2(ab)(cd)(ac)(bd).,解析:(1)由已知,该校有女生400人,故 12+m 20+8 400 560,得m8,从而n20812848.(2)作出22列联表如表所示由表中数据,得K2 48 16096 2 28203216 24 35 0.685 73.841,所以没有95%的把握认为该校学生一周参加社区服务时间是否超过1小时与性别有关,

此文档下载收益归作者所有

下载文档
收起
展开