1©陈强,2015年,《计量经济学及Stata应用》,高等教育出版社。第5章多元线性回归5.1二元线性回归一元回归很可能遗漏了其他因素。比如,在关于教育投资回报率的研究中,将工资对数对教育年限回归。工资还依赖于个人能力,而个人能力未包括在回归方程中,故被纳入扰动项。2能力强的人通常上学更久(二者正相关),故一元回归所估计的教育回报率事实上也包括了对能力的回报,导致估计出现偏差。其他遗漏变量还包括年龄、工龄、性别、种族、相貌等,其中年龄与工龄可视为“在职培训”(onthejobtraining)的代理变量,而在职培训是增加人力资本(humancapital)的另一重要方式。本章考虑多元回归。首先考察二元回归。12(1,,)iiiiyxxin(5.1)1ix与2ix为解释变量。为截距项。3为在给定2x条件下,1x对y的边际效应(忽略扰动项i)。为在给定1x条件下,2x对y的边际效应。OLS估计量的最优化问题仍为残差平方和最小化:2212ˆˆˆ,,11ˆˆˆmin()nniiiiiieyxx(5.2)寻找一个回归平面12ˆˆˆˆiiiyxx,即估计参数ˆˆˆ,,,使得所有样本点121(,,)niiiixxy离此回归平面最近,参见图5.1。4将表达式(5.2)分别对ˆˆˆ,,求偏导数,可得此最小化问题的一阶条件,求解可获得ˆˆˆ,,的OLS估计量。图5.1二元线性回归的示意图1xy2x5例(Cobb-Douglas生产函数)CobbandDouglas(1928)使用美国1899-1922年制造业产出(y)、资本(k)与劳动力(l)的数据,估计如下生产函数:ttttykle(5.3)te为乘积形式的扰动项,下标t表示时间(年)。两边取对数,可转换为线性模型:lnlnlnlnttttykl(5.4)6数据集cobb_douglas.dta提供了CobbandDouglas(1928)的原始数据。首先看数据集中的观测值。.usecobb_douglas.dta,clear.list724.19224311612406.0661085.0814045.48063923.19214171471796.0330864.9904335.18738622.19204071932316.0088135.262695.44241821.19193871932185.9584255.262695.38449520.19183662002235.9026335.2983175.40717219.19173351962275.814135.2781155.4249518.19162981822255.6970935.2040075.41610117.19152661541895.5834965.0369525.24174716.19142441491695.4971685.0039465.12989915.19132361541845.4638325.0369525.21493614.19122261521775.4205355.023885.1761513.19112161451535.3752784.9767345.03043812.191020814415...