多元线性回归模型推断•1.零条件均值假定(u的均值为零)𝐸(𝛽𝑗)=𝛽𝑗•2.同方差假定:u的方差为𝜎2𝑣𝑎𝑟𝛽𝑗=𝜎2𝑆𝑆𝑇𝑗(1−𝑅𝑗2)•但𝛽𝑗的分布仍可能具有任何形式。•当我们把样本中的自变量的值视为既定时,OLS估计量的抽样分布取决于其背后的误差分布。假定MLR.6正态性假定•总体误差u独立于解释变量𝑥1,𝑥2,……,𝑥𝑘,而且服从均值为零和方差为𝜎2的正态分布:𝑢~𝑁(0,𝜎2)–比之前的任何假定更强,正态性假定意味着零条件均值假定和同方差假定成立。•经典线性模型假定CLM:MLR.1~MLR.6–在CLM假定下,在所有的无偏估计中,OLS估计量具有最小的方差。•与BLUEs的区别在于,OLS估计量最小方差的性质不再局限于线性估计量的比较中。–CLM总体假定:𝑦|𝑥~𝑁(𝛽0+𝛽1𝑥1+⋯+𝛽𝑘,𝜎2)对于正态性假设的讨论•1.由于u是影响着y而又观测不到的许多因素之和,无论这些不可观测因素的总体分布如何,都可以借助中心极限定理推断u具有近似正态分布。中心极限定理:令𝑌1,𝑌2,⋯,𝑌𝑛为一个有均值𝜇和方差𝜎2的随机样本,于是𝑌−𝜇𝜎𝑛~𝑁(0,1)•2.以上推理可能存在的问题。–u的众多因素可能各有极为不同的分布,此时根据中心极限定理虽然仍成立,但正态近似可能不那么好。–以上推定采用中心极限定理,基于假定u中所有不可观测因素都以各自的和可加的方式影响着y,如果u是不可观测因素的复杂函数,则中心极限定理论证不再适用。•3.是否可以假定u的正态性,是一个经验性问题。–通常利用对数变换可以得到更接近于正态的分布。–如果y仅取少数几个值,或仅取正值,则正态性假定明显不成立。但相对于很大的样本容量来说,误差的非正态性不算严重的问题。正态抽样分布•定理4.1在CLM假定MLR.1~MLR.6下,给定自变量的样本值,有𝛽𝑗~𝑁(𝛽𝑗,𝑣𝑎𝑟(𝛽𝑗))其中,𝑣𝑎𝑟𝛽𝑗=𝜎2𝑆𝑆𝑇𝑗(1−𝑅𝑗2)因此,𝛽𝑗−𝛽𝑗𝑠𝑑(𝛽𝑗)~𝑁(0,1)假设检验•一.对单个总体参数的t检验•定理4.2(标准化估计量的t分布)在CLM假定MLR.1~MLR.6下,有𝛽𝑗−𝛽𝑗𝑠𝑒(𝛽𝑗)~𝑡𝑛−𝑘−1式中,k+1为总体模型中未知参数的个数。1.对单侧对立假设的检验𝐻1:𝛽𝑗>0•一般在单侧对立假设检验中并不关心原假设。•1.确定显著性水平,即当𝐻0实际上正确时拒绝它的概率(拒真)(一般选择5%)。•2.临界值:在显著性水平∝上的含有n-k-1个自由度的t分布的临界值对应着处在以上分布的百分位中第100(1-∝)位的数值,用c表示。•3.单侧对立建设检验的拒绝法则是𝑡𝛽𝑗...