第9章统计9.2.2总体百分位数的估计9.2.3总体集中趋势的估计9.2.4总体离散程度的估计第p百分位数1第p百分位数1第p百分位数的概念一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或者等于这个值,且至少有(100-p)%的数据大于或者等于这个值.通过下面的步骤计算一组n个数据的第p百分位数按从小到大排列原始数据第p百分位数1第p百分位数的概念除了上页计算一组n个数据的第p百分位数的方法外,再介绍另外一种方法,这种方法是SPSS所用方法之一,也是SAS所用方法之一.计算指数,设(n+1)p=j+g,j为整数部分,g为小数部分将n个变量值从小到大排列,X(j)表示此数列中第j个数①当g=0时,第p百分位数=X(j);②当g≠0时,第p百分位数=g*X(j+1)+(1-g)*X(j)=X(j)+g*[X(j+1)-X(j)]第p百分位数1四分位数在实际应用中,除了中位数外,常用的分位数还有第25百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.另外,像第1百分位数,第5百分位数,第95百分位数和第99百分位数在统计中也经常被应用.总体集中趋势的估计2总体集中趋势的估计2平均数一组数据的和与这组数据个数的商.如:定义特征“”平均数对数据有取齐的作用,代表该组数据的平均水平,任何一个数据的改变,都会引起平均数的变化,这是众数和中位数都不具有的性质,所以与众数中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中极端值的影响较大,使平均数在估计总体时的可靠性降低.总体集中趋势的估计2平均数加权平均数与频率平均数加权平均数频率平均数总体集中趋势的估计2众数一组数据中出现次数最多的数据(即频率分布最大值对应的样本数据)成为这组数据的众数.定义特征一组数据的众数可能不止一个,也可能没有,反映了该组数据的集中趋势1,2,3,4,5,6,7,8,9,10没有众数1,2,3,4,4,5,5,6,7众数有两个,分别是4和51,2,3,4,5,5,6,7,8众数是5总体集中趋势的估计2中位数一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间的两个数据的平均数(当数据个数是偶数时),称为这组数据的中位数.定义特征一组数据的中位数是唯一的反映了该组数据的集中趋势,在频率分布直方图中中位数左边和右边的直方图的面积相等总体集中趋势的...