1原创精品资源学科网独家享有版权,侵权必究!2020-2021学年高二理数学下学期期末专项复习(人教A版选修2-3)知识梳理第三章统计案例知识点一回归分析的基本思想及其初步应用1.线性回归模型(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)在回归模型中,y的值由x和随机因素e共同确定,即x只能解释部分y的变化,x称为解释变量,y称为预报变量,e称为随机误差,它的均值E(e)=0,方差D(e)=σ2>0.2.线性回归分析1)线性回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方程为y=bx+a__,则b==,a=y-bx.其中,b是回归方程的斜率,a是在y轴上的截距.回归直线一定过样本点的中心(x,y).2)回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(x,y)称为样本点的中心.(3)相关系数当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.4)残差图法作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样2原创精品资源学科网独家享有版权,侵权必究!作出的图形称为残差图.在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.残差平方和(yi-yi)2,残差平方和越小,模型拟合效果越好.5)相关指数:用R2刻画回归效果在回归分析中,可以用R2=来刻画回归的效果,它表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好.知识点二独立性检验的基本思想及期初步应用1.分类变量和列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表,称为列联表.②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为下表.y1y2总计x1aba+bx2cdc...