第十章直线相关与直线回归问题的引入变量间关系问题:身高~体重、凝血时间~凝血酶浓度、肺活量~体重、药物剂量与动物死亡率等。相关分析——用于研究事物或现象之间有无相关关系(或互依关系)、关系的方向和密切程度。回归分析——用于研究事物或现象之间的数量依存关系。相关分析和回归分析都属于双变量分析范畴。第一节直线相关分析一、直线相关的概念二、相关系数的意义及计算三、相关系数的假设检验一、直线相关的概念直线相关(linearcorrelation):又称简单相关(simplecorrelation),用于研究两个来自正态分布总体的连续性随机变量X和Y之间的线性关系。最直观的方法是绘制散点图。实例编号身高(m)X体重(l)YX2Y2XY(1)(2)(3)(4)(5)(6)11.7424.6503.03521.6238.10021.7184.2782.95218.3017.35031.7144.4202.93819.5367.57641.7124.3792.93119.1767.497161.6923.9112.86315.2966.617合计27.26666.29346.471275.73113.04表12-116名18-22岁男大学生肺活量及身高测量资料二、相关系数的意义及计算相关系数(correlationcoefficient):又称积差相关系数,是反映两个变量线性关系的方向和密切程度的指标,用符号r表示。相关系数的特点:①r是没有单位的数值,取值范围为②③11r为零相关。为完全相关,为负相关为正相关,0100rrrr,说明相关性越差。越接近于,说明相关性越好;越接近于01rr图7-4相关系数示意图图12-2相关系数示意图应当注意的几点:Rr是样本相关系数,是总体相关系数的估计值。相关关系并不一定是因果关系,只反映两变量的互依或伴随关系。相关分析的任务是对相关关系给予定量的描述。相关系数的计算:nYYnXXnYXXYYYXXYYXX222222)()())((YYXXXYlllr的离均差积和和表示的离均差平方和表示的离均差平方和表示YXlYlXlXYYYXX三、相关系数的假设检验r≠0原因:①由于抽样误差引起,ρ=0②存在相关关系,ρ≠0公式:2212210rnrnrrSrtr=,υ=n-2Sr----样本相关系数的标准误(一)t检验法:(二)查表法:根据自由度查相关系数r界值表(附表12)。K=1,自由度v,查r0.05,r0.01。R>r0.05,p<0.05,相关。表112名女大学生身高与体重的相关编号身高(cm)(X)体重(kg)(Y)115251215846316755417260516255616656718065817766917268101726011156561216455r=0.8342一、...