1©陈强,2015年,《计量经济学及Stata应用》,高等教育出版社。第11章二值选择模型11.1二值选择模型如果被解释变量y离散,称为“离散选择模型”(discretechoicemodel)或“定性反应模型”(qualitativeresponsemodel)。最常见的离散选择模型是二值选择行为(binarychoices)。比如:考研或不考研;就业或待业;买房或不买房;买保险或不买保险;贷款申请被批准或拒绝;出国或不出国;回国或不回2国;战争或和平;生或死。假设个体只有两种选择,比如1y(考研)或0y(不考研)。最简单的建模方法为“线性概率模型”(LinearProbabilityModel,LPM):1122(1,,)iiiKiKiiiyxxxin+++x(11.1)其中,解释变量12()iiiiKxxxx,而参数12()Kβ。LPM的优点是,计算方便,容易得到边际效应(即回归系数)。3LPM的缺点是,虽然y的取值非0即1,但根据线性概率模型所作的预测值却可能出现ˆ1y或ˆ0y的不现实情形。图11.1线性概率模型4为使y的预测值介于[0,1]之间,在给定x的情况下,考虑y的两点分布概率:P(1|)(,)P(0|)1(,)yFyFxxxx(11.2)函数(,)Fxβ称为“连接函数”(linkfunction),因为它将x与y连接起来。y的取值要么为0,要么为1,故y肯定服从两点分布。连接函数的选择具有一定灵活性。通过选择合适的连接函数(,)Fx(比如,某随机变量的累积分布函数),可保证ˆ01y,并将ˆy理解为“1y”发生的概率,因为5E(|)1P(1|)0P(0|)P(1|)yyyyxxxx(11.3)如果(,)Fx为标准正态的累积分布函数,则P(1|)(,)()()yFtdtxxxx(11.4)()与()分别为标准正态的密度与累积分布函数;此模型称为“Probit”。如果(,)Fx为“逻辑分布”(logisticdistribution)的累积分布函数,则exp()P(1|)(,)()1exp()yFxxxxx(11.5)6其中,函数()的定义为exp()()1exp()zzz;此模型称为“Logit”。逻辑分布的密度函数关于原点对称,期望为0,方差为23(大于标准正态的方差),具有厚尾(fattails)。Probit与Logit都很常用,二者的估计结果(比如边际效应)通常很接近。Logit模型的优势在于,逻辑分布的累积分布函数有解析表达式(标准正态没有),故计算Logit更为方便;而且Logit的回归系数更易解释其经济意义。70.2.4.6.81概率密度-505xProbitLogit图11.2标准正态分布与逻辑分布的累积分布函数811.2最大似然估计的原理Probit与Logit模型本...