分享
14.4.3 用频率直方图估计总体分布 14.4.4 百分位数.pptx
下载文档

ID:3450412

大小:2.12MB

页数:48页

格式:PPTX

时间:2024-05-08

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
14.4 频率 直方图 估计 总体 分布 百分 位数
高中同步学案优化设计,GAO ZHONG TONG BU XUE AN YOU HUA SHE JI,第14章,2022,内容索引,课前篇 自主预习,课堂篇 探究学习,课标阐释,1.结合实例,能用频率直方图估计总体分布.(几何直观、数学运算)2.能用样本估计百分位数,理解百分位数的统计含义.(数学运算、逻辑推理),思维脉络,课前篇 自主预习,【激趣诱思】某大学数学考试结果公布,根据规定,0.8%的同学需要补考.那么如何确定需要补考的分数线呢?(提示:利用百分位数计算),【知识梳理】,一、用频率直方图估计总体分布(1)利用频率直方图求数字特征:众数是最高的矩形的底边的中点值.中位数左右两侧直方图的面积相等.平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.(2)利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致.直方图能粗略估计众数、中位数和平均数,名师点析(1)平均数是频率直方图的“重心”,是直方图的平衡点,因此,每个小矩形的面积与小矩形底边中点的横坐标的乘积之和即为平均数的估计值.(2)根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率直方图中,中位数左边和右边的直方图的面积应该相等.(3)一般来说,对一个单峰的频率直方图来说,如果直方图的形状是对称的(图),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(图),那么平均数大于中位数;如果直方图在左边“拖尾”(图),那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.,微思考频率直方图的组数对数据分析有何影响?提示 当组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息;当组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易看出总体数据的分布特点.,微练习党的十八大以来,脱贫攻坚取得显著成绩.2013年到2016年4年间,累计脱贫5 564万人.2017年各地根据实际进行创新,精准、高效地完成了脱贫任务.某地区对当地3 000户家庭的2017年所得年收入情况进行调查统计,年收入的频率直方图如图所示,数据(单位:千元)的分组依次为20,40),40,60),60,80),80,100,则年收入不超过6万元的家庭大约有()A.900户B.600户C.300户D.150户,答案 A解析 由频率直方图得,年收入不超过6万元的家庭的频率为(0.005+0.010)20=0.3,所以年收入不超过6万元的家庭大约有 0.33 000=900(户).,二、第p百分位数1.定义:一般地,一组数据的k百分位数是这样一个值pk,它使得这组数据中至少有k%的数据小于或等于pk,且至少有(100-k)%的数据大于或等于pk.如果将样本数据从小到大排列成一行,那么k百分位数pk所处位置如图所示.,2.计算一组n个数据的大样本的k百分位数的步骤第1步将所有数值按从小到大的顺序排列;,名师点析(1)50百分位数就是中位数,中位数是百分位数的特例,百分位数是中位数的推广;(2)中位数即为50百分位数,我们也把中位数、25百分位数和75百分位数称为四分位数.,微判断(1)若一组样本数据各不相等,则其75百分位数大于25百分位数.()(2)若一组样本数据的10百分位数是23,则在这组数据中有10%的数据大于23.()(3)若一组样本数据的24百分位数是24,则在这组数据中至少有76%的数据大于或等于24.(),微练习(2021安徽合肥庐阳期末)高一某班10名学生的英语口语测试成绩(单位:分)如下:76,90,84,82,81,87,86,82,85,83.这组数据的第75百分位数是()A.85B.86C.85.5D.86.5答案 B解析 从小到大的顺序排列数据为76,81,82,82,83,84,85,86,87,90,因为1075%=7.5,所以这组数据的75百分位数是第八个数据86.,课堂篇 探究学习,例1某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率直方图如图所示.(1)估计这次测试数学成绩的众数;(2)估计这次测试数学成绩的中位数(保留一位小数);(3)估计这次测试数学成绩的平均数.,解(1)由题干图知众数为=75,则这80名学生的数学成绩的众数约为75.(2)由题干图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.40.5,因此中位数位于第四个矩形内,设为x,得0.1=0.03(x-70),所以x73.3,即这80名学生的数学成绩的中位数约为73.3.(3)由题干图知这次数学成绩的平均数约为,要点笔记 在频率直方图中,我们无法知道每个组内的数据是如何分布的,此时,通常假设它们在组内均匀分布,这样就可以获得样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数.,变式训练1从高一抽出50名学生参加数学竞赛,由成绩得到如图的频率直方图.由于一些数据丢失,试利用频率直方图估计:,(1)这50名学生成绩的众数与中位数(保留一位小数);(2)这50名学生的平均成绩.,解(1)由众数的概念可知,众数是出现次数最多的数.在频率直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75.由于中位数是所有数据中的中间值,故在频率直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就使中位数左右两边的小矩形的面积和相等,因为0.00410+0.00610+0.0210=0.04+0.06+0.2=0.3,所以前三个小矩形面积的和为0.3.而第四个小矩形面积为0.0310=0.3,0.3+0.30.5,所以中位数约位于第四个小矩形内.设其底边为x,高为0.03,所以令0.03x=0.2,得x6.7,故中位数约为70+6.7=76.7.,(2)样本平均值应是频率直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.所以平均成绩为45(0.00410)+55(0.00610)+65(0.0210)+75(0.0310)+85(0.02110)+95(0.01610)=73.65(分).,例2从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的25,50,95百分位数;(2)请你找出珍珠质量较小的前15%的珍珠质量;(3)若用25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.,解(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以1225%=3,1250%=6,1295%=11.4,95百分位数是第12个数据为9.9.,(2)因为共有12个数据,所以1215%=1.8,则15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8 g,7.9 g.(3)由(1)可知样本数据的25百分位数是8.15 g,50百分位数为8.5 g,95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.,反思感悟 计算一组n个数据的第p百分位数的一般步骤:(1)排列:按照从小到大排列原始数据.(2)算i:计算i=np%.(3)定数:若i不是整数,大于i的最小整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.,变式训练2如图所示是某市3月1日至3月10日的最低气温(单位:)的情况绘制的折线统计图,由图可知这10天最低气温的80百分位数是()A.-2B.0C.1D.2,答案 D解析 由折线图可知,这10天的最低气温按照从小到大的排列为-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以1080%=8,是整数,则这10天最低气温的80百分位数是=2.,例3某市为了鼓励居民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.,(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式.(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率直方图.若这100户居民中,今年1月份用电费用低于260元的占80%,求a,b的值.(3)根据(2)中求得的数据计算用电量的75百分位数.,解(1)当0 x200时,y=0.5x;当200400时,y=0.5200+0.8200+1.0(x-400)=x-140.(2)由(1)可知,当y=260时,x=400,即用电量低于400千瓦时的占80%,结合频率直方图可知,(3)设75百分位数为m,因为用电量低于300千瓦时的所占比例为(0.001+0.002+0.003)100=60%,用电量低于400千瓦时的占80%,所以75百分位数m在300,400)内,所以0.6+(m-300)0.002=0.75,解得m=375,即用电量的75百分位数为375千瓦时.技巧方法 由频率直方图求百分位数的常用方法(1)要注意频率直方图中小矩形的面积,就是数据落在该组的频率.(2)一般采用方程的思想,设出p百分位数,根据其意义列出方程并求解.,变式训练3(2021福建泉州丰泽期末)某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组(第一组20,25),第二组25,30),第三组30,35),第四组35,40),第五组40,45),得到如图所示的频率直方图,已知第一组有5人.,(1)求x.(2)求抽取的x人的年龄的50百分位数(结果保留整数).(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99.求这10人成绩的20百分位数和平均数.以这两个数据为依据,评价参赛人员对“一带一路”的认知程度,并谈谈你的感想.,数据分析百分位数的统计含义典例 一家保险公司决定对推销员实行月标管理,按以往月销售额(单位:千元)把推销员分为甲、乙、丙三个层次,各层次人数如下:,(1)为了了解推销员对目标设定的意见,决定从甲、乙、丙三个层次中采取比例分配的分层抽样抽取30人进行座谈,请计算甲、乙、丙三个层次各应抽取多少人?,(2)确定的销售目标是否合适,直接影响到公司的经济效益:如果目标定得过高,多数推销员完不成任务,会使推销员失去信心;如果目标定得太低,将不利于挖掘推销员的工作潜力.现已知按上面的方法抽取了部分推销员的月销售额(单位:千元):14.2 15.8 17.7 19.2 22.4 18.2 16.4 21.8 15.6 24.623.2 19.8 12.8 13.5 16.3 11.5 13.6 14.9 15.7 16.217.0 17.2 17.8 18.0 18.4 20.5 21.5 22.1 24.0 24.8公司为了使75%的推销员能够完成销售目标,根据这组样本数据,应将销售目标定为多少?,(2)将30个数据按照从小到大的顺序进行排序,可得:11.5,12.8,13.5,13.6,14.2,14.9,15.6,15.7,15.8,16.2,16.3,16.4,17.0,17.2,17.7,17.8,18.0,18.2,18.4,19.2,19.8,20.5,21.5,21.8,22.1,22.4,23.2,24.0,24.6,24.8,为使得75%的销售员完成目标,则没有完成目标的员工占25%,只需求出25百分位数即可.由3025%=7.5,可知样本数据的25百分位数为第8项数据,即为15.7.所以应该将销售目标定为15 700元比较合理.,方法点睛 1.百分位数是用于衡量数据位置的量度,但它所衡量的,不一定是中心位置.百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息.对于无大量重复的数据,p百分位数将它分为两个部分.大约有p%的数据项的值比p百分位数小;而大约有(100-p)%的数据项的值比p百分位数大.对p百分位数,严格的定义如下:p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值.2.百分位数是统计学术语,百分位数用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可全面描述一组观察值的分布特征,比如在医学上常应用百分位数进行数据分析和诊断;但应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数.,变式训练某次期中考试一考生成绩处在95百分位数上,能否认为该考生这次答对了总分的百分之九十五呢?解 对于考试成绩的统计,如果该考生的成绩处在95百分位数上,则意味着95%的参加考试者得到了和该考生一样的考分或还要低的考分,而不是该考生答对了95%的试题,也许该考生只答对了20%,即使如此,该考生取得的成绩也与95%的参加考试者一样好,或者比95%的参加考试者更好.,1.下列一组数据的25百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A.3.2B.3.0C.4.4D.2.5答案 A解析 把该组数据按照由小到大排列,可得2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由25=2.5,不是整数,则第3个数据3.2是25百分位数.,2.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的30百分位数为()A.8.4B.8.5C.8.6D.8.3答案 A解析 因为30=2.4,故30百分位数是第三个数据8.4.,3.(2021陕西安康期末)某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在40,100内.现将这些分数分成6组并画出样本的频率直方图,但不小心污损了部分图形,如图所示观察图形,则下列说法错误的是()A.频率直方图中第三组的频数为15人B.根据频率直方图估计样本的众数为75分C.根据频率直方图估计样本的中位数为75分D.根据频率直方图估计样本的平均数为75分,答案 D解析 分数在60,70)内的频率为1-10(0.005+0.015+0.030+0.025+0.010)=0.15,所以第三组60,70)的频数为1000.15=15(人),故A正确;因为众数的估计值是频率直方图中最高矩形的中点,从图中可看出众数的估计值为75分,故B正确;因为(0.005+0.015+0.015)10=0.350.5,所以中位数为70+10=75,故C正确;样本平均数的估计值为45(100.005)+55(100.015)+65(100.015)+75(100.03)+85(100.025)+95(100.01)=73.5(分),故D错误.,4.一组样本数据的频率直方图如图所示,试估计此样本数据的50百分位数为.,解析 样本数据低于10的比例为(0.08+0.02)4=0.40,样本数据低于14的比例为0.40+0.094=0.76,所以此样本数据的50百分位数在10,14)内,估计此样本数据的50百分位数为,更多精彩内容请登录志鸿优化网http:/www.zhyh.org/,本 课 结 束,

此文档下载收益归作者所有

下载文档
收起
展开