01/26/20251第一页,共七十五页。一、多元线性回归根本概念多元线性回归简称多元回归,是研究一个应变量与多个自变量间线性依存关系数量变化规律的一种方法。多元线性回归方程mmXbXbXbbY22110ˆ式中:b0为回归方程常数项,bj(j=1,2,┅,m)为偏回归系数,即在其他自变量固定的条件下,Xj改变一个单位时应变量的改变量。01/26/20252第二页,共七十五页。预测应变量的估计值探索影响应变量y的主要因素当X为某一定值时,估计应变量y的容许区间当X为某一定值时,估计其应变量的总体均数的置信区间YˆYStY,ˆiYˆYˆYStYˆ,ˆ01/26/20253第三页,共七十五页。01/26/20254第四页,共七十五页。model语句的[选项]selection=method规定变量筛选方法,method可以是以下几种选项:forward〔或f〕前进法,按照sle规定的P值从无到有依次选一个变量进入模型backward〔或b〕后退法,按照sls规定的P值从含有全部变量的模型开始,以次剔除一个变量。stepwise逐步法,按照sle的标准依次选入变量,同时对模型中现有的变量按sls的标准剔除不显著的变量。注:[选项]中没有selection语句时,模型中含有全部自变量的回归模型。sle=概率值入选标准,规定变量入选模型的显著性水平,前进法默认为0.5,逐步法默认为0.15。sls=概率值剔除标准,指定变量保存在模型的显著性水平,后退法默认为0.1,逐步法默认为0.15。01/26/20255第五页,共七十五页。stb输出各自变量的标准偏回归系数。cli输出个体y值的95%容许区间上下限clm输出预测值均值的95%可信区间上下限。P输出实际值Yi,预测值、残差及其标准误。tol输出各自变量的容许值。0≤tol值≤1,越接近于0,共线性越严重。vif输出各自变量的方差膨胀因子。当vif≥10时,可认为多元共线性严重存在。collin要求详细分析自变量之间的共线性,给出信息矩阵的特征根、条件指数和方差比,当条件指数≥10,方差比>0.5时,可认为存在多元共线性。collinoint与选择项collin作用相同,但不包括回归常数。R进行预测值的残差分析〔即异常值识别与强影响分析〕,输出学生化残差值和Cook’s距离D值。当学生化残差值>2时,所对应的点可能是异常点,当D值>0.5时,可认为对应的变量值对回归函数是强影响点。YStY,ˆYˆYStYˆ,ˆiYˆ01/26/20256第六页,共七十五页。完全多元线性回归例7-710名女中学生的体重〔X1,kg〕,胸围〔X2,cm〕,...