第7章参数估计估计量与估计值(estimator&estimatedvalue)1.估计量:用于估计总体参数的随机变量如样本均值,样本比例,样本方差等例如:样本均值就是总体均值m的一个估计量1.参数用q表示,估计量用表示2.估计值:估计参数时计算出来的统计量的具体值如果样本均值`x=80,则80就是m的估计值点估计与区间估计点估计(pointestimate)1.用样本的估计量的某个取值直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计2.无法给出估计值接近总体参数程度的信息虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量区间估计(intervalestimate)1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在75~85之间,置信水平是95%区间估计的图示置信水平(confidencelevel)1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平2.表示为(1-a)%a为是总体参数未在区间内的比例3.常用的置信水平值有99%,95%,90%相应的a为0.01,0.05,0.10置信区间(confidenceinterval)1.由样本统计量所构造的总体参数的估计区间称为置信区间2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个总体参数以一定的概率落在这一区间的表述是错误的置信区间(95%的置信区间)评价估计量的标准无偏性(unbiasedness)无偏性:估计量抽样分布的数学期望等于被估计的总体参数有效性(efficiency)一致性(consistency)一致性:随着样本量的增大,估计量的值越来越接近被估计的总体参数一个总体参数的区间估计总体均值的区间估计(正态总体、s2已知,或非正态总体、大样本)总体均值的区间估计(大样本)1.假定条件总体服从正态分布,且方差(s2)已知如果不是正态分布,可由正态分布来近似(n³30)2.使用正态分布统计量...