§3.6含有虚拟变量的多元线性回归模型一、含有虚拟变量的模型一、虚拟变量的引入二、虚拟变量的设置原则一、含有虚拟变量的模型1、虚拟变量(dummyvariables)•许多经济变量是可以定量度量。•一些影响经济变量的因素是无法定量度量。•为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”。•这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量,记为D。•虚拟变量只作为解释变量。•一般地,在虚拟变量的设置中:–基础类型、肯定类型取值为1;–比较类型,否定类型取值为0。•例如,反映文程度的虚拟变量可取为:–D=1,本科学历–D=0,非本科学历•虚拟变量能否取1、0以外的数值?2、虚拟变量模型•同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-ofvariance:ANOVA)模型。•例如,一个以性别为虚拟变量考察企业职工薪金的模型:iiiiDXY210其中:Yi为企业职工的薪金;Xi为工龄;Di=1,若是男性,Di=0,若是女性。二、虚拟变量的引入1、加法方式•虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。•上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。–在该模型中,如果仍假定E(i)=0,则企业男、女职工的平均薪金为:iiiiXDXYE10)0,|(iiiiXDXYE120)()1,|(–假定2>0,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差2。–可以通过对2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。年薪Y男职工女职工工龄X02•将上例中的性别换成教育水平,教育水平考虑三个层次:高中以下、高中、大学及其以上。011D其他高中012D其他大学及iiiDDXY231210iiiXDDXYE1021)0,0,|(iiiXDDXYE12021)()0,1,|(iiiXDDXYE13021)()1,0,|(高中以下高中大学及以上•在上例中同时引入性别和教育水平:女男011D大学以下大学及以上012DiiiDDXY231210女职工本科以下学历的平均薪金:iiiXDDXYE13021)()1,0,|(女职工本科以上学历的平均薪金:iiiXDDXYE132021)()1,1,|(iiiXDDXYE1021)0,0,|(ii...