中华人民共和国国家标准UDC.519.113.25:620数据的统计处理和解释均值的估计和置信区间GB3360-82StatisticalinterpretationofdataEstimationofthemean-Confidenceinterval本标准适用于对抽自正态总体的随机样本所作的一系列试验的基础上,在总体方差未知的情形下,估计该总体的均值,或者利用试验所得的数据计算出一个区间,使得这个区间以给定的概率包含总体均值。对于总体概率分布遵从正态分布的假定可以广泛地得到满足:在一定的试验条件下,所得试验结果的分布经常是正态分布或者近似正态分布。本标准假定,用来进行测定的个体,构成一个来自原总体的独立随机样本。变换试验结果的原点或单位可以使计算简化。如果没有试验上、技术上或其他的明显理由作为依据,则不许剔除任何观侧值或修正可疑的观测值。试验方法可能受到系统误差(可确定原因的误差)的约束。本标准假定没有系统误差。系统误差的存在可能使下述的方法失}Co计算所得的区间称为均值的置信区间,与它相关联的是置信水平。置信水平是置信区间包含总体均值的概率,通常用百分数表示。本标准仅考虑95%和99吓两个水平。本标准是参考国际标准ISO2602《试验结果的统计解释一一一均值的估计和置信区间》(1980年第二版)制订的。1均值的估计1.1不分组的情形在剔除可疑数据后,这批数据包含n个观测值x;(i=1.2.-"",n),其中某些可能取相同的值。用n个数据的算术平均X估计正态分布的均值uX=上I二nj=11.2分组的情形当数据的个数很大(比如在50以上)时,可以将它们按等间隔分组。在某些情形,也可能直接获得分组的数据。n;表示第i组的频数,即是第i组中数据的个数。k表示组数,则有n=芝niY;表示第i组的中点,用所有组的中点的加权算术平均夕作为均值#的估计。Y二n;戈k笼国家标准局1982一、2-30发布,984-01一01实施GB9360一822均值的皿信区间利用总体均值和标准差的估计量可以计算总体均值的置信区间。计算置信区间的另一种方法是利用极差,这种方法在附录A中给出。2.1标准差的估计2.1.1不分组的情形标准差o的估计公式如下:、=/兴么x;一x)Z式中:xinx第i个观测值(i观测值的总个数;=1,2,⋯,n)n个观测值的算术平均。为了计算方便,建议使用下列公式:S=1〔冬x?n=1}=}一土(艺x,)2lni二12.1.2分组的情形标准差a的估计公式如下:S=n一1k艺n;(Yi一夕),为了计算方便,建议使用下列公式:“=了1n一1k}n;YZ一二(kn;Yi)Z〕yL几n式中:第i组的中点(i=1,2,·,k);组数.第1组中观测值的个数;kn—观测值的总个数,n二乏...