多元回归分析其他问题改变数据测度单位•(1)(2)(3)bwghtbwghtlbsbwghtcigs-0.4634-0.02890.09160.0057packs-9.2681.832faminc0.09270.00580.09270.02920.00180.0292intercept116.9747.3109116.9741.0490.06561.049观测个数138813881388R20.02980.02980.0298SSR557485.512177.6778557485.51SSE20.0631.253920.063标准化系数•对于使用对数函数形式的进一步讨论•含有交互项的模型•调整R2•在两个非嵌套模型中进行选择••预测的置信区间解释变量取值在样本中•预测的置信区间解释变量取值不在样本之中•残差分析•残差分析:考察个体因变量的观测值与预测值的关系•应用:–房屋价格:房屋价格对房屋特征进行回归,负的残差代表了房屋价格被低估。–法学院排名:法学院起薪中位数对学生特征进行回归,残差代表了法学院的附加值。•二值因变量:线性概率模型•例8已婚妇女劳动力参与状况••政策分析和项目评价含有虚拟变量的多元线性回归需要注意的问题:•1.对照组和处理组存在系统性差异:–即对照组和处理组并非随机指定的,他们之间可能在别的方面还存在系统性差别(能够影响因变量),需要控制这些因素。–比如研究种族对贷款被批准概率的影响(以判断种族歧视),不同种族在收入、财富、信用等级等方面存在系统差异,需要加以控制,否则会高估种族因素的影响。•2.自选择:参与与否并不是随机决定的,个人(或城市、企业)自己选择加入某个项目,会导致零条件均值假定不成立(存在内生性)。–例如研究是否加入对有子女家庭的援助计划(政府项目)与婴儿体重之间的关系。父母选择是否加入援助计划可能与婴儿体重有关系,家庭贫困或父母健康状况较差的家庭更倾向于加入这种援助计划,而这些家庭的婴儿体重本身可能就偏低。–需要控制这些因素。多元回归分析能够在某种程度上缓解自选择问题。