§2.5一元线性回归分析的应用:预测问题一、预测值是条件均值或个别值的一个无偏估计二、总体条件均值与个别值预测值的置信区间•对于一元线性回归模型iiXY10ˆˆˆ给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值Ŷ0,可以此作为其条件均值E(Y|X=X0)或个别值Y0的一个近似估计。•严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因:•参数估计量不确定;•随机项的影响。说明一、预测值是条件均值或个值的一个无偏估计1、Ŷ0是条件均值E(Y|X=X0)的无偏估计对总体回归函数E(Y|X=X0)=0+1X,X=X0时E(Y|X=X0)=0+1X00100ˆˆˆXY0101000100)ˆ()ˆ()ˆˆ()ˆ(XEXEXEYE可见,Ŷ0是条件均值E(Y|X=X0)的无偏估计。2、Ŷ0是个值Y0的无偏估计对总体回归模型Y=0+1X+,当X=X0时0100XY0100100100)()()(XEXXEYE0100ˆˆˆXY0101000100)ˆ()ˆ()ˆˆ()ˆ(XEXEXEYE可见,Ŷ0是个值Y0的无偏估计。二、总体条件均值与个值预测值的置信区间1、总体均值预测值的置信区间0100ˆˆˆXY),(~ˆ2211ixN),(~ˆ22200iixnXN0101000)ˆ()ˆ()ˆ(XEXEYE)ˆ()ˆ,ˆ(2)ˆ()ˆ(12010000VarXCovXVarYVar2210/)ˆ,ˆ(ixXCov222022022202)ˆ(iiiixXxXXxnXYVar200222222XXXXnXnXxii))((20222XXnxxii))(1(2202ixXXn)))(1(,(~ˆ22020100ixXXnXNY)2(~)(ˆ0ˆ0100ntSXYtY于是,在1-的置信度下,总体均值E(Y|X0)的置信区间为0202ˆ00ˆ0ˆ)|(ˆYYStYXYEStY2、总体个值预测值的预测区间),(~20100XNY)))(11(,0(~ˆ220200ixXXnNYY)2(~ˆ00ˆ00ntSYYtYY从而在1-的置信度下,Y0的置信区间为00202ˆ000ˆ0ˆˆYYYYStYYStY3、例题—收入-消费支出•样本回归函数为则在X0=1000处,Ŷ0=142.4+0.670×1000=812.4•因此,总体均值E(Y|X=1000)的95%的置信区间为:(812.4-2.30627.6,812.4+2.30627.6)(748.8,875.9)iiXY670.04.142ˆ4.7607425000)21501000(1012734)ˆ(20YVar6.27)ˆ(0YS•同样地,对于Y在X=1000的个体值,其95%的置信区间为:(812.4-2.30659.1,812.4+2.30659.1)(676.1,948.7)