第十章统计回归模型10.1牙膏的销售量10.2软件开发人员的薪金10.3酶促反应10.4投资额与国民生产总值和物价指数回归模型是用统计分析方法建立的最常用的一类模型数学建模的基本方法机理分析测试分析通过对数据的统计分析,找出与数据拟合最好的模型•不涉及回归分析的数学原理和方法•通过实例讨论如何选择不同类型的模型•对软件得到的结果进行分析,对模型进行改进由于客观事物内部规律的复杂及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型。10.1牙膏的销售量问题建立牙膏销售量与价格、广告投入之间的模型预测在不同价格和广告费用下的牙膏销售量收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期其它厂家同类牙膏的平均售价9.260.556.804.253.70307.930.055.803.853.80298.510.256.754.003.7527.38-0.055.503.803.851销售量(百万支)价格差(元)广告费用(百万元)其它厂家价格(元)本公司价格(元)销售周期基本模型y~公司牙膏销售量x1~其它厂家与本公司价格差x2~公司广告费用110xy222210xxy55.566.577.577.588.599.510x2y-0.200.20.40.677.588.599.510x1y22322110xxxyx1,x2~解释变量(回归变量,自变量)y~被解释变量(因变量)0,1,2,3~回归系数~随机误差(均值为零的正态分布随机变量)MATLAB统计工具箱模型求解[b,bint,r,rint,stats]=regress(y,x,alpha)输入x=~n4数据矩阵,第1列为全1向量]1[2221xxxalpha(置信水平,0.05)22322110xxxyb~的估计值bint~b的置信区间r~残差向量y-xbrint~r的置信区间Stats~检验统计量R2,F,py~n维数据向量输出由数据y,x1,x2估计参数参数估计值置信区间17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p=0.00000123结果分析y的90.54%可由模型确定参数参数估计值置信区间17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p=0.0000012322322110xxxyF远超过F检验的临界值p远小于=0.052的置信区间包含零点(右端点距零点很近)x2对因变量y的影响不太显著x22项显著可将x2保留在模型中模型从整体上看成立22322110ˆˆˆˆˆxxxy销售量预测价格差x1=其它厂家价格x3-本公司价格x4估计x3调整x4控制价格差x...