电脑桌面
添加蜗牛文库到电脑桌面
安装后可以在桌面快捷访问

常用统计方法(SPSS)期末考试题型总结

栏目:合同范文发布:2025-01-29浏览:1收藏

常用统计方法(SPSS)期末考试题型总结

第一篇:常用统计方法(SPSS)期末考试题型总结

SPSS期末考试题型总结

一、单样本t检验(单个正态总体的均值检验与置信区间)(P48)

1、题目类型:某糖厂打包机打包的糖果标准值为问:(1)这天打包机的工作是否正常?

(2)这天打包机平均装糖量的置信区间是多少?,给出一系列抽取值。

2、操作:(1)Analyze Compare mean One-Sample T Test(2)将左边源变量X送入Test Variable(s)中,在Test Value中输入

3、结果分析:若Sig.>0.05,接受假设,即没有显著性差异

若Sig.<0.05,拒绝假设,即有显著性差异

置信区间(100+Lower,100+uppper)

二、两个样本t检验(两个正态总体的均值检验与置信区间)(P50)

1、题目类型:从A批导线抽取4根,从B批导线抽取5根。

问:这两批导线的平均电阻是否有显著差异?并求的置信区间。

2、操作:(1)Analyze Compare mean Indepvendent Sample T Test

(2)将检验变量x送入Test Variable(s),将分组变量group送入Grouping Variable(3)选按钮define GroupsUse specified values,分别输入1和2.3、结果分析:(1)若F显著性概率Sig.>0.05,接受假设

性差异,即可认为两组方差是相等的

(2)若t显著性概率Sig.2-tailed>0.05,可以得出A、B两批电

线的电阻值没有显著差异。,两组方差没有显著

三、单因素方差分析(P54)

1、题目类型:6种不同农药在相同条件下的杀虫率。

问:杀虫率是否因农药的不同而有显著性差异?

2、操作:(1)Analyze Compare mean One-Way ANOV

(2)将源变量x送入Dependent List(因变量),将类型变量kind送入Factor.3、结果分析:(1)若Sig.>0.05,接受假设,即没有显著性差异

(2)若Sig.<0.05,拒绝假设,有显著性差异,此时进一步操作:

继续操作:(a)Options Homogeneity of variance test(b)Post HocLSD

四、双因素方差分析(P62)

1、题目类型:三种浓度,四种温度的每一种搭配下的产品产量。

问:试检验不同浓度,不同温度以及它们之间的交互作用对产量有无显著影响?

2、操作:(1)Analyze General Linear Model Univarate

(2)测试变量(产量)送入Dependent Variable,因素变量(温度、浓度)一起送入Fixed Factor

3、结果分析:(1)若A因素Sig.>0.05,则A因素对产量无显著性影响,反之

(2)若B因素Sig.>0.05,则A因素对产量无显著性影响,反之。

(3)若A*B因素Sig.>0.05,则A与B的交互作用对产量无显著性

影响,反之则反。

4、注意:(1)输入数据时注意排版,因素A、B的分类。

(2)不考虑交互作用时,Model Custom,把要考虑的a、b等因素送入右边;考虑交互作用时,Model Full factorial五、一元线性回归模型(P71)

1、题目类型:某公司科研支出x与利润y的表格

问:求出线性模型,并检验该模型是否显著以及给出模型的标准误差

2、操作:(1)作图Graplsscatter/potsimple scatter,判断为线性。

(2)Analyze Regression Linear(3)将因变量y送入Dependent,将自变量x送入Independent

3、结果分析:(1)B列的数值为回归系数,其中Constant为常数项。Y=20+2x(2)若Sig.<0.05,则***显著不为0,***是一个重要变量。

六、多元线性回归模型(P76)

1、题目类型:课本例子

问:试求y对x1,x2,x3,x4的最佳线性模型。

2、操作:(1)作图Graplsscatter/potsimple scatter,判断为线性。

(2)AnalyzeRegression Linear

(3)将因变量y送入Dependent,将自变量x1,x2,x3,x4送入Independent(4)若enter模型不好,则进行逐步回归法,选Model stepwise

3、结果分析:(1)R值越接近1,模型越好。

(2)F值显著性概率Sig.<0.01,回归模型非常显著。

(3)若Sig.<0.05,则***显著不为0,***是一个重要变量。

4、预测:AnalyzeRegression Linear save 选Unstandardized(预测值),或选Inpidual(区间值)

七、曲线回归模型(P88)

1、题目类型:对200只鸭进行试验,得到周龄x与日增重y的数据。

问:求出线性模型,并检验该模型是否显著以及给出模型的标准误差

2、操作:(1)作图Graplsscatter/potsimple scatter,判断曲线类型。

(2)AnalyzeRegression Curve Estimation

(3)将因变量y送入Dependent,将自变量x送入Independent(4)在Model中,选Quadratic(二次曲线)或其他

3、结果分析:(1)R值越接近1,模型越好。

(2)F值显著性概率Sig.<0.01,回归模型非常显著。

八、相关分析(P93)

1、题目类型:13名男生的身高与体重表。

问:试研究x与y的相关性。

2、操作:(1)Analyze correlateBivariate

(2)将源变量x、y送入Variables

3、结果分析:若Sig.<0.01,说明非常显著,即身高与体重的相关性非常强。

九、卡方检验(拟合度检验)(P103)

1、题目类型:200个观察数据,包含组下限和频数的表。

问:试检验该数据是否服从[0,1]上的均匀分布?

2、操作:(1)定义变量x,为组下限或上限。注意输入方式

(2)确定Weight为频数变量,Data Weight Class Weight cases by,将变量Weight送入Frequency Variable.(3)Analyze Nonparametric testChi-Square(4)将检验变量x送入Test Variable

3、结果分析:Sig.>0.05,故认为从该表抽取的数据服从[0,1]上的均匀分布。

十、K-S检验(独立性检验)(P112)

1、题目类型:从车间中抽取50个样本,得到纤维强力指标。

问:试检验纤维强力指标是否服从正态分布?

2、操作:(1)Analyze Nonparametric test 1-sample K-S test

(2)将检验变量x送入Test Variable List,选Normal(正态分布)

3、结果分析:Sig.>0.05,故认为纤维的强力指标服从正态分布。

十一、列联表分析(P132)

1、题目类型:研究两类病人与自杀情绪之间有没有某种连带关系

2、操作:(1)输入数据,注意形式。确定f为频数变量,Data Weight Class Weight cases by,将变量f送入Frequency Variable.(2)AnalyzeDescriptive StatisticsCrosstabs

(3)把患者类型[kind]送入Row(行),把自杀情绪[emotion]送入Column(列)(4)选StatisticsChi-Square

3、结果分析:若Sig.>0.05,接受,故认为患者类型和有无自杀情绪是相互独立。

【注意】:

1、怎样区分双因素方差分析和列联表分析? 答:提问的方式不一样。

双因素方差分析:***是否有显著影响。列联表:***是否独立。

第二篇:SPSS多重比较常用方法总结

1.1 LSD法 最小显著差异法,公式为:

它其实只是t检验的一个简单变形,并未对检验水准做出任何校正,只是在标准误的计算上充分利用了样本信息, 为所有组的均数统一估计出了一个更为稳健的标准误,其中MS误差 是方差分析中计算得来的组内均方,它一般用于计划好的多重比较。由于单次比较的检验水准仍为α,因此可认为LSD法是最灵敏的。

1.2 Bonferroni法 该法又称Bonferroni t检验,由Bonferroni提出。用t检验完成各组间均值的配对比较,但通过设置每个检验的误差率来控制整个误差率。若每次检验水准为α′,共进行m 次比较,当H0 为真时,犯Ⅰ类错误的累积概率α不超过mα′, 既有Bonferroni不等式α≤mα′成立。

α′=αm=αC2k=2αk(k…XB)S… dAB,S… dAB = MS误差1nA+1nB 但是该方法在样本组数较小时效果较好,当比较次数m 较多时,结论偏于保守。

1.3 Sidak法 它实际上就是Sidak校正在LSD法上的应用,即通过Sidak校正降低每两次比较的Ⅰ类错误概率,以达到最终整个比较的Ⅰ类错误概率为α的目的。即α′= 11);t =(…XA…XB)/MS误差21nA+1nB,它实质上是根据预先制定的准则将各组均数分为多个子集, 利用Studentized Range分布来进行假设检验,并根据所要检验的均数的个数调整总的Ⅰ类错误概率不超过α。用student range分布进行所有各组均值间的配对比较。如果各组样本含量相等或者选择了(差异较小的子集)的均值配对比较。在该比较过程中,各组均值从大到小按顺序排列,最先比较最末端的差异。1.5 Dunnett2t检验

t =…Xi1以及检验水准α查Dunnett2t界值表,作出推断。

1.6 Duncan法(新复极差法)(SSR)指定一系列的“range”值,逐步进行计算比较得出结论。

q′=(…XA…XB | ≥T时,可以认为比较的两组总体均数μA 与μB 有差别;反之,尚不能认为μA 与μB 有差别。该方法要求各组样本含量相同,且一般不会增大Ⅰ型错误的概率。用student range统计量进行所有组间均值的配对比较,用所有配对比较误差率作为实验误差率。

1.8 Scheffe检验

检验统计量为F,计算公式为:F =(…XA1)即当| …XA1)时,可以认为在α水准上,比较的两组总体均数μA 与μB 有差别。k为处理组数, Fα(ν1,ν2)为在α水准上,方差分析中的组间自由度为ν1(ν1 = kk)时,由方差分析用F界值表查得的F临界值。

以上8种多重检验方法由于使用方便,计算简单而被广大科研工作者接受。

第三篇:统计方法总结

一、统计分析方法总结

1.连续性资料

1.1 两组独立样本比较

1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。

1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。

1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。

1.2 两组配对样本的比较

1.2.1 两组差值服从正态分布,采用配对t检验。

1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。

1.3 多组完全随机样本比较

1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。

1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。

1.4 多组随机区组样本比较

1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。

1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。

****需要注意的问题:

(1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。

(2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确**

(3)关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。

2.分类资料

2.1 四格表资料

2.1.1 例数大于40,且所有理论数大于5,则用普通的Pearson 检验。

2.1.2 例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的 检验或Fisher’s确切概率法检验。

2.1.3 例数小于40,或有理论数小于2,则用Fisher’s确切概率法检验。

2.2 2×C表或R×2表资料的统计分析

2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher’s确切概率法检验。

2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon秩和检验。

2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。

2.3 R×C表资料的统计分析

2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher’s确切概率法检验。(3)如果要作相关性分析,可采用Pearson相关系数。

2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 检验只说明组间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。

2.2.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。

2.2.4 列变量&行变量均为有序多分类变量,(1)如要做组间差别分析,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。(2)如果要做两变量之间的相关性,可采用Spearson相关分析。

2.4 配对分类资料的统计分析

2.4.1 四格表配对资料,(1)b+c>40,则用McNemar配对 检验。(2)b+c<40,则用校正的配对 检验。

2.4.1 C×C资料,(1)配对比较:用McNemar配对 检验。(2)一致性检验,用Kappa检验。

二、医学科研程序

⑴科研选题——⑵研究设计——⑶实施方法——⑷统计分析——⑸总结归纳

其中科研选题和研究设计最关键。科研设计分为⑴专业设计⑵统计设计

统计设计的内容:研究对象数量的确定、对照组的选定、随机化分组原则、控制误差及统计分析方法的选定等。

一、科研选题:⑴、查阅文献;⑵、选题原则:创新性、先进性、科学性、可行性;⑶、研究条件和优势

二、实施方法:⑴、调查;⑵、实验⑶、临床观察。

三、统计分析:⑴、正确搜集资料;⑵、描述资料统计特征⑶、统计推断并得出结论统计资料的要求:准确、完整、及时

描述资料:统计表、统计图、统计指标

统计推断:参数估计、假设检验

医学科研设计基本内容(临床实验设计参考用)

(社区干预试验设计可参照)

临床科研是以病人为研究对象,因此,在进行临床科研设计时应注意:①人有社会属性,受精神因素、心理因素影响,要注意临床科研要符合医学伦理要求;②必须设立对照(设立对照的注意问题附后);③随访的起点和止点应有明确的定义;④注意影响实验研究结果的因素,并适当控制(具体内容附后)。

1.国内外研究现状、水平、发展趋势(简要介绍与本课题有关研究的国内外现状、水平、发展趋势等,写明本课题提出的依据及本课题研究目的;简要介绍预试验内容及结果。)。

2.研究对象:

(1)具体诊断标准(用公认的或统一的,并阐明出处;如没有统一的标准也应写明是自定标准。)、制定入选(纳入)标准及排除标准;

(2)研究对象选择范围(包括对照组)及选样和分组方法(使用正确的随机方法选样和分组;在实验对象的分组和施加因素分配实验组、对照组上,都要随机化);

(3)样本含量。(说明确定样本含量的依据)3.处理因素:(详细写)

处理因素设置要求:①抓住主要因素;②找出非处理因素(混杂因素);③处理因素标准化。

(1)设备(或试剂或药物)生产厂家(来源)及型号(剂量);(2)治疗方法及操作程序(包括对照组);(3)操作过程中的质量控制(包括方法、人员、设备三统一及实验质控手段等);(4)技术关键。4.研究结果:

确定研究效应的测量指标及测定方法,要考虑与待评价的结果有关联性、客观性、灵敏性、特异性及实用性等。

(1)疗效判断标准(用公认的或统一的,并阐明出处;如没有统一的标准也应写明是自定标准。);

(2)(近期、远期)观察指标(各组观察指标应一致)及观察方法;(3)科研记录表格及汇总表格式样;(4)统计方法及指标确定,预计结果;(5)科研质量控制措施(包括科研全过程的各环节,如预试验工作、分组、施加处理因素、临床观察及随访、原始资料的记录及收集、资料整理等方面质量控制措施)。

5.创新设想(本研究的):

6.工作时间安排(包括调研、设计、研究、统计分析、总结鉴定等): 7.研究人员分工(包括姓名、性别、年龄、职称、工作单位及在本研究中的详细分工):

8.经费的筹措及使用计划:

9.存在(可能出现)的问题、困难及解决办法: 临床科研的对照问题

为保证临床科研实验组与对照组之间具有可比性,对照组中的观察对象除了实验因素不同以外,实验过程中的实验条件和辅助措施,都应与实验组相同。常用对照方式如下:

1、空白对照:对照组不施加任何处理因素。这种对照仅用在某些病情较轻或长期稳定无任何危险的疾病,如:慢性关节炎、HbsAg携带者、近视等。

2、安慰剂对照:对照组采用无药理作用且无害的“药“,如:淀粉、生理盐水等经加工后其外形、味道等与试验药相似,不被受试者识别。这种对照仅用在研究的疾病尚无有效治疗方法,或使用安慰剂后该病的病情、临床经过、预后等影响小或无影响时。

3、实验对照:对照组不施加处理因素,但施加某种与处理因素有关的实验因素。

4、标准对照:用现有标准方法或常规方法做对照,注意以一种低疗效的方法作对照来提高试验的疗效是毫无意义的,甚至是有害的。

5、历史对照:以过去的研究结果作对照,这是一种非随机和非同期的对照,容易产生偏倚(可能因为疾病自然病程会随时间而变化,或医生的收治病人诊断标准和治疗方法或水平因时间而变化等,使两组失去可比性)。这种对照可用于狂犬病、骨折愈合等疗效对照。

6、自身对照:对照和实验在同一受试对象进行,这种对照简单易行,但应注意该方法的两个缺陷:一是实验总是把处理前作对照,这不符合随机分配原则;二是实验前后某些环境因素或自身因素发生了改变,可能影响实验结果。可考虑用交叉实验解决。

7、相互对照:多种待研究观察因素相互对照。

目前常用的设计方案有:随机对照实验、配对实验、交叉实验(适于病程较长的实验研究),可根据具体情况,选用适合的方法进行实验研究。

10、影响实验研究结果的因素及其控制

一、误差:

1、随机误差:通过增加样本含量,可减小随机误差,但不能消除。

2、非随机误差:

非系统误差:偶然失误造成的。

系统误差:误差值遵循一定的规律而存在或变化,增加样本量,不能纠正。

二、编倚:(可以看成是一种系统误差)

1、选择性偏倚:防止选择性偏倚的措施:①正确拟定观察对象的纳入和排除标准;②采用分层抽样方法;③正确设立对照;④遵守随机化原则。

2、测量偏倚(或称观察偏倚或信息偏倚):

产生原因:①沾染(对照组也接受了处理措施);②干扰;③依从与非依从;④失访(>20%);⑤检查与诊断结果不一致;⑥观察记录有误;⑦心理因素的干扰。

防止措施:①用盲法试验;②签定实验合同;③检查实验对象的依从情况;④注意医德问题;⑤定期检查研究记录;⑥对实验方法、诊断标准的一致性在实验前应做出估计。

3、混杂偏倚:

产生原因:多在总结分析阶段,评价被研究因素与疾病之间的关系时,如果存在外来因素与该病和研究因素均有联系,使研究因素效应与外来因素效应混

在一起,从而掩盖或夸大研究因素与疾病的真实联系。

防止措施:①设计时,用配对设计或采用分层抽样方法;②分析阶段,用分层分析技术或多变量回归分析技术。其目的是平衡混杂因素的作用。

医学科研设计基本内容(调查设计参考用)

1、国内外研究现状、水平、发展趋势(简要介绍与本课题有关研究的国内外现状、水平、发展趋势等,写明本课题提出的依据及研究目的。注意:研究目的应很明确,且围绕一个中心;简要介绍预试验内容及结果。)。

2、调查计划:

⑴、确定观察对象(所要研究的总体)和观察单位(总体中的个体统计对象)⑵、选定调查指标(调查指标是调查目的的具体体现):指标选择要求:①精选、重点突出,不要贪多求全,分散精力。②计量指标比计数指标敏感。③客观指标优于主观指标。④选用灵敏度高,特异度高的检查方法作为诊断依据。

⑶、调查方法(普查、抽样调查等)

⑷、样本含量(说明确定样本含量的依据)

⑸、收集原始资料的调查方式(直接观察、直接采访(访问调查、自填调查)、间接采访(信访、电话))

⑹、设计调查表和问卷(调查表和问卷设计相关问题附后)

⑺、调查阶段的组织工作(包括组织领导、关系协调、调查员培训等)

⑻、设计阶段质量控制:①正确划分调查范围;②尽量选择客观、明确的指标;③对调查问题进行精选,避免问题过于繁杂;④对于可能引起混淆的调查项目给出明确的定义。

⑼、调查阶段质量控制:①通过预试验工作完善调查设计;②抓好调查员的选拔和培训,避免因调查员工作态度不好或业务水平不足而影响调查结果;③对被调查者可能存在的拒绝、躲避、隐瞒、等问题,采取相应措施,如:开展宣传、摸清被调查者在家的时间规律、对敏感问题做好解释和保密工作,对记忆不清者,可请知情人帮助回忆;④在问卷中设置相反问题,以了解应答的可靠性;⑤选择调查方式时应考虑年龄和文化水平因素;⑥对检测项目的调查应注明检测设备、试剂等生产厂家、型号、批号;操作过程应注意操作方法(包括诊断标准)、人员、设备(应有明确的校正灵敏度及准确度的方法及时间)三统一;⑦注意调查的效度(真实性)与信度(可靠性)问题,常采用现场抽样复查来评价调查信度等。

3、整理计划:(去粗取精,去伪存真)

⑴、计算机录入与整理工作:应提出确保录入质量的措施:①在建立数据库时,编写逻辑查错程序;②同一资料用两个录入员输入并用计算机核对;③资料录入完成后,做频数表或散点图,发现异常值;④正确选择合适的指标和分析方法等。

⑵、资料分组:(按数值大小分组、按类型分组等)⑶、分组组数确定:

4、统计分析计划:(包括:①说明指标的内涵和计算方法及预期进行统计描述和推断内容;②拟进行的探索性分析;③控制混杂因素的措施;④列出统计分析表,并通过统计分析表检查调查、整理计划有否遗漏。)

5、创新设想(本研究的):

6、工作时间安排(包括调研、设计、研究、统计分析、总结鉴定等):

7、研究人员分工(包括姓名、性别、年龄、职称、单位及在本研究中的详细分工):

8、经费的筹措及使用计划:

9、存在(可能出现)的问题、困难及解决办法:

10、调查表及问卷设计相关问题 一、一般结构:

1、前言:用于说明调查目的、重要性、回答问题的必要性以及对调查内容保密等,以取得调查对象的合作。

2、填写说明:为保证所有调查员和调查对象均能对调查项目和填写方法正确理解,统一认识而编写。

3、核(备)查项目:该部分与调查目的无关,作核查核对用。内容包括调查员姓名、调查日期、复核结果、未调查原因等。

4、调查(分析)项目:为直接用于调查指标所必须以及排除混杂因素所必须的项目,包括调查对象的①背景资料,如:姓名、住址、单位、电话等;②人口学项目,如:年龄、性别、民族、婚姻状况、文化程度、职业等;③研究项目(该部分是调查表的核心内容,依不同调查目的而定,分问题项目和检测项目)。

二、问题的形式:问题的基本形式有提问式和陈述式两种;根据问题答案的形式分开放式问题(无统一答案)和封闭式问题(有固定答案)。

封闭式问题设计注意:

1、答案应包括所有可能的答案,还应有“其它”一栏;

2、各选择答案不应相互包含,不应有重叠情况。

三、问题设计的一般原则:

1、尽量避免用专业术语(提问一般就低不就高);

2、避免混淆,对语义较模糊的词(如:经常、偶尔、普通、大概等)应给出本次调查的定义或标准。

3、避免双重问题,避免一个问题中实际提出两个问题。

4、提问避免诱导或强制性(否定形式的提问有诱导之嫌);对有社会期望偏倚的问题应注意。

5、问题应适合全部调查对象并符合逻辑。

6、敏感问题的处理:对国家政策、伦理道德、经济收入、生活行为、其它个人隐私等敏感问题,可以采用对象转移法或假定法提问;关于敏感问题调查的随机应答技术问题,须参考有关统计学专著。

7、调查项目的安排顺序(注意问题顺序的逻辑性)①、一般问题在前,特殊问题在后; ②、易答问题在前,难答问题在后;

③、敏感问题一般在最后;如敏感问题较多,可分散在问卷中,以降低其敏感性;

④、一般将问题项目放在前,检测项目放在后。

第四篇:SPSS总结

SPSS的基本统计功能

1、数据的预处理

2、描述性统计和探索性统计

3、假设检验(包括参数检验、非参数检验等)

4、方差分析(包括一般的方差分析和多元方差分析)

5、相关分析

6、回归分析

7、多元统计分析,包括聚类分析、判别分析、因子分析、对应分析、主成分分析等

8、时间序列分析

9、信度分析

10、数据挖掘:决策树与神经网络

SPSS 统计分析的一般步骤

1、建立SPSS数据文件: 在【变量视图】定义SPSS数据文件的结构,在【数据视图】进行录入数据文件的录入。

2、SPSS数据的管理数据的预处理 :

集中于【数据】和【转换】两个菜单项。

3、SPSS数据的统计分析阶段

: 在【分析】菜单中选择正确的统计方法。

4、SPSS分析结果的阅读和解释

: 读懂SPSS输出窗口中的分析结果

5、明确其统计含义,并结合背景知识做出合理的解释。

第2章 SPSS统计分析前的准备

一、SPSS数据文件的特点

1、SPSS数据文件是一种有结构的数据文件(一般文本文件仅有纯数据部分,而没有关于结构的描述);

2、由数据的结构和内容两部分构成;

3、其中数据的结构记录数据类型、取值说明、数据缺失等必要信息(在【变量视图】,每一列大家都要明白你在定义什么,有什么用);

4、数据的内容是那些待分析的具体数据;

5、在【数据视图】每一列代表一个变量(variable),变量名显示在表格顶部;

6、在【数据视图】的每一行代表一个记录(case)(即一个案例,或称一个对象、一个观察、一个个体),记录序号显示在表格的左侧;

7、在【数据视图】可以输入和编辑数据,但是不能输入数学表达式和函数

二、定义变量

1、【数据视图】是进行数据输入、数据编辑的界面,对应的表格用于查看、录入和修改数据。

2、【变量视图】 是定义数据文件的变量的界面,对应的表格用于输入和修改变量的定义。

3、用SPSS读取其他格式的数据:

1)数据文件:*。sav

语法文件:*。sps 结果文件:*。spo

脚本文件: *。sbs 2)文件-打开-数据,可打开多种文件类型(。sav、。xls、。dbf、。txt、。dat等)

注:要想顺利打开txt文档,txt文档最好有固定的分隔符,如一个空格或一个逗号等。

三、数据的编辑

在SPSS中,数据文件的编辑、整理等功能被集中在了【数据】和【转换】两个菜单项中:

1、数据的增删、复制、剪切、粘贴;

2、数据的排序,Sort Cases排序便于数据的浏览,快捷找到最大值或最小值,迅速发现数据的异常值;

四、文件的拆分:文件的拆分相当于统计学中的数据分组,即将数据按一个或几个分组变量分组。

五、数据选取 :

数据选取(个案选取)的基本方式

按指定条件选取(If condition is satisfied)

随机抽样(Random sample of cases)选取某一区域内(Based on time or case range)

六、个案加权:记录加权是对观测数据赋以权重,常用于频数表资料;

七、文件的合并:合并文件是指将外部数据中的记录或变量合并到当前的数据文件中去。合并数据文件包括两种方式:

从外部数据文件增加记录到当前数据文件中——纵向合并或称追加记录。从外部数据文件增加变量到当前数据文件中——横向合并或称追加变量。

八、变量的计算和变换:【转换】-【计算变量】

九、数据的重新编码recode 统计分组

将字符型变量转换为数值型变量 将几个小类别合为一个类别 将数值型变量转换为字符型

十、统计结果的保存为word文件:【文件】-【导出】

第3章

SPSS描述性统计

1.Frequencies(频率)过程的特色是产生频数表;功能 产生频数分布表;

绘制条形图、饼图、直方图;

计算集中趋势与离散程度、分布形状(峰度和偏度的意义)等统计量; 按要求给出分位数;

对数据的分布趋势进行初步分析

(注:对于定性变量来说,一般来说产生频数分布表,制作条形图,饼图即可);

2.描述分析(Descriptives过程)

适用的分析对象:定量变量,测度为scale。功能:

调用此过程对变量进行描述性统计分析,计算均值、标准差、全距和均值标准误差等; 并可将原始数据转换成Z分数((原始值-均值)/标准差)。

3.Explore(探索)过程用于对数据概况不清时的探索性分析,定量变量; 在一般描述性统计分析的基础上,增加有关数据其他特征的文字与图形描述。提供茎叶图、箱线图、PP图、QQ图等;

指出异常值(Outliers),可检查数据是否有错误,剔除异常值和错误数据; 进行点估计和区间估计,计算均值的置信区间,; 检验一组数据是否呈正态分布; 4.列联表分析

(1)列联表分析的适用条件

对一个定量变量的描述和分析,一般用频数分析(频数分布表、饼图、直方图、条形图); 对两个定性变量的描述和分析,通常使用列联表、对应分析,或使用卡方检验; 对两个以上定性变量的描述和分析,通常使用高维列联表。(2)期望频数的分布

如果行变量和列变量是独立的,可以计算出列联表中每个格子里的频数应该是多少,称为期望频数;

(3)列联表分析的基本思路

检验列联表中的行变量与列变量之间是否独立(或是否相关)。原假设为行变量与列变量之间独立(或不相关)。比较观察频数与期望频数的差。

如果两者的差越大,表明实际情况与原假设相去甚远;如果差越小,表明实际情况与原假设越相近。

对于这个假设的检验,可以采用卡方分布,进行卡方检验。

(4)列联表分析的步骤

检验列联表中的行变量与列变量之间是否独立(是否相关)提出假设

H0:行变量与列变量独立(不相关)H1:行变量与列变量不独立(相关 计算检验的统计量 统计决策

进行决策:P值决策

P<0。05,则拒绝原假设H0,否则,接收原假设。(5)Pearson卡方检验的应用条件

所有单元的期望频数应该大于1,或不应有大量的期望频数小于5的单元格。

如果列联表中有20%以上的单元格中的期望频数小于5,则一般不宜用卡方检验。Pearson卡方检验最普遍

第4章

SPSS的均值比较过程 1。Means过程

对准备比较的各组计算描述指标,进行预分析,也可直接比较,定量变量。(1)Means过程是专门计算各种平均数,并对平均数进行简单比较的;(2)虽然Descriptive Statistics(描述统计)菜单项中的几个过程也能计算均数,但Means过程的输出结果是将各组的描述指标放在一起的,便于相互比较;

(3)Means过程必须设置分组变量,若没有分组变量的话,可以使用Descriptive Statistics菜单项中的几个过程。

(4)适用于测度水平为SCALE的变量。

2。单样本T检验(1)目的

检验某变量的总体均值与指定的检验值之间是否存在显著差异。(2)适用条件

样本来自的总体服从正态分布(3)基本步骤

H0: μ=μ0 H1: μ≠μ0

构造检验统计量 统计决策

如果P值<α(α一般取值为0。05),拒绝原假设; 如果P值>α,接受原假设;

3。

独立样本T 检验(1)目的

通过比较两个样本均值差的大小来确定两个总体的均值是否相等。(2)适用条件

独立性:两个样本相互独立,且均为大样本;

正态性:如果两个样本相互独立但都是小样本,或有一个样本是小样本,则要求总体服从正态分布;

方差齐性

(3)基本步骤

a、方差齐性F检验

原假设:两个总体方差相等; 备则假设:两个总体方差不相等;

P值<0。05 时,拒绝原假设,说明方差不齐;否则两个总体方差无显著性差异。b、对两总体的均值提出假设 H0: μ1=μ2

H1: μ1≠μ2 c、统计决策

在SPSS中进行两独立样本t检验时,应首先对F检验作判断。如果方差相等,观察分析结果中Equal variances assumed列的t检验相伴概率值;如果方差不相等,观察Equal variances not assumed列的t检验相伴概率值。如果P值<α,拒绝原假设; 如果P值>α,不能拒绝原假设;

4.配对样本的T 检验

配对样本是指对同一样本的某个变量进行前后两次测试所获得的两组数据,或是对两个完全相同的样本在不同条件下进行测试所获得的两组数据。其差别在于抽样不是相互独立的,而是互相关联的。(1)配对样本通常有两个特征: 第一,两组样本的样本数相同;

第二,两个样本记录的先后顺序一一对应,不能随意更改。(2)适用条件

两样本数据必须两两配对 两总体服从正态分布

配对样本的录入方式是:每对数据在同一个case的两个配对的变量上(3)检验步骤 a、提出假设 H0: μ1=μ2

H1: μ1≠μ2 b、统计决策

如果P值<α,拒绝原假设; 如果P值>α,不能拒绝原假设;

第5章 方差分析

如何对一个或两个总体的均值进行检验,我们可以用均值比较,如果要讨论多个总体均值是否相等,我们所采用的方法是方差分析。

方差分析中有以下几个重要概念。(1)因素(Factor):是指所要研究的变量,它可能对因变量产生影响。如果方差分析只针对一个因素进行,称为单因素方差分析。如果同时针对多个因素进行,称为多因素方差分析。

(2)水平(Level):水平指因素的具体表现,如销售的四种方式就是因素的不同取值等级。

(3)单元(Cell):指因素水平之间的组合。(4)元素(Element):指用于测量因变量的最小单位。一个单元里可以只有一个元素,也可以有多个元素。

(5)交互作用(Interaction):如果一个因素的效应大小在另一个因素不同水平下明显不同,则称两因素间存在交互作用。

1.单因素方差分析

单因素方差分析也叫一维方差分析,它用来研究一个因素的不同水平是否对观测变量产生了显著影响,即检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。(1)适用条件

在各个水平之下观察对象是独立随机抽样,即独立性;

各个水平的因变量服从正态分布,即正态性;

各个水平下的总体具有相同的方差,即方差齐性;(2)基本原理

SST(总的离差平方和)=SSA(组间离差平方和)+SSE(组内离差平方和)

如果在总的离差平方和中,组间离差平方和所占比例较大,说明观测变量的变动主要是由因素的不同水平引起的,可以主要由因素的变动来解释,系统性差异给观测变量带来了显著影响;反之,如果组间离差平方和所占比例很小,说明观测变量的变动主要由随机变量因素引起的。

SPSS将自动计算检验统计量和相伴概率P值,若P<α,则拒绝原假设,认为因素的不同水平对观测变量产生显著影响;反之,接受零假设,认为因素的不同水平没有对观测变量产生显著影响。

另外,SPSS还提供了多重比较方法,多重比较是通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异,最常用的多重比较方法是LSD。(3)检验步骤 a、提出假设

H0: 各个总体的均值无显著性差异。

H1: 各个总体的均值有显著性差异。b、统计决策

方差齐性检验结果,P值>0。05,方差齐,否则,方差不齐;

单因素方差分析表,P值>α,接受H0,都则,拒绝H0,接受H1。

2.多因素方差分析

多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。它不仅能够分析多个因素对观测变量的独立影响,更能够分析多个因素的交互作用能否对观测变量产生显著影响。(2)基本原理

由于多因素方差分析中观察变量不仅要受到多个因素独立作用的影响,而且因素其交互作用和一些随机因素都会对变量产生影响。因此观测变量值的波动要受到多个控制变量独立作用、控制变量交互作用及随机因素等三方面的影响。以两个因素为例,可以表示为:

Q总=Q控1+Q控2+Q控1控2+Q随其中,Q表示各部分对应的离差平方和。多因素方差分析比较

Q

1、Q 控

2、Q 控 1 控

Q

占 Q

总 的比例,以此推断不同因素以及因素之间的交互作用

2、是否给观测变量带来显著影响。

(3)基本术语

a、Dependent Variable 观测变量或因变量 主要指研究中的定量变量

如:移动话费、学生成绩、销售量、亩产量等

b、Fixed Factor 固定效应因素,固定因素,控制因素

主要指研究中的定性变量

如:资费等级、客户类型、漫游类型、促销策略等 c、Random Factor 随机效应因素、随机因素

人为无法对其水平值进行准确控制,只是能够直观观测到

如:话费水平、收入水平、消费习惯等

d、Interaction 交互作用、交互效应

如果一个因素的效应大小在另一个因素不同水平下明显不同,则称为两因素间存在交互作用。

当存在交互作用时,单纯研究某个因素的作用是没有意义的,必须分另一个因素的不同水平研究该因素的作用大小。例如:饮食习惯、适量运动对减肥的作用; e、main effect 与交互效应相对应的

主效应就是每个因素对因变量的单独影响(main effect)f、Covariates 协变量

指对应变量可能有影响,需要在分析时对其作用加以控制的连续性定量变量 当模型中存在协变量时,一般是通过找出它与因变量的回归关系来控制其影响(3)应用条件

等方差;

各样本的独立性:只有各样本为相互独立的随机样本,才能保证变异的可加性(可分解性);

正态性:即所有观察值系从正态总体中抽样得出;(4)基本步骤

提出假设

H0:因素A中的r个水平的均值相等(因素A 对因变量无显著性影响)H1:因素A中的r个水平的均值不全相等(因素A 对因变量有显著性影响)统计决断 P值检验法

依次查看各F值的P值,p-值<α,应拒绝原假设; 如果其P值大于显著性水平,则不能拒绝H0,可以认为相应不同水平的控制变量或交互影响没有造成均值的显著差异;

第6章

非参数检验

非参数检验(nonparametric test),又称为任意分布检验(distribution-free test); 不依赖于总体的分布类型,对样本所来自总体的分布不作严格假定的统计推断方法,称为非参数检验(nonparametric test)

它不考虑研究对象总体分布的具体形式,也不对总体参数进行统计推断;

而是通过检验样本所代表的总体分布位置及分布形状是否一致来得出统计结论。特点

参数检验条件不满足时的处理方法

不对均数等参数检验,而是检验分布是否相同

在总体分布未知的情况下,利用样本数据对总体的分布形态进行推断。非参数检验的着眼点不是总体参数,而是总体的分布情况 非参数检验研究目标总体的分布是否与已知理论分布相同 非参数检验研究各样本所在总体的分布位置,形状是否相同 优点

第一,具有较好的稳健性;

第二,受限条件少:对数据要求不像参数检验那样严格

第三,适用范围广:可应用于各种不同的情况,不受总体分布形状的限制,适合处理无法精确数量化的定性数据和小样本数据 第四,计算通常较简单,且容易理解 缺点

第一,将定量数据转换为定性数据时,漏失了数据的一些信息

第二,检验的敏感度和效果,均不如参数检验好。检验效率低于参数检验,主要是犯第二类错误的可能性加大。

第三,参数检验适用的数据,非参数方法会降低检验效能;当数据满足参数检验条件时,效能低于参数法,不满足参数法条件时,处于“优势” 非参数检验的应用场合

定量数据,不满足参数检验的条件,且无适当的变量变换方法解决此问题; 定量数据,其分布类型无法获知,且为小样本; 定量数据,极度偏态,或个别数值偏离过大; 各组离散度相差悬殊

一端或两端存在不确定数值的定量数据

定序数据,比较各组间等级强度的差别; 非参数检验的主要方法 单个样本的非参数检验

卡方检验(Chi-Square过程)

二项检验(Binomial过程)

游程检验(Runs过程)

柯尔莫哥洛夫—斯米诺夫检验(l-Sample K-S过程)两个独立样本的非参数检验 多个独立样本的非参数检验 两个配对样本的非参数检验 多个配对样本的非参数检验 顺序统计量

通过对数据从小到大的排序(即排队),并由数据的大小排序号(排队号)代替原始数据进行统计分析。

秩(Rank):排序号(排队号)在统计学上称为秩

结(ties):绝对值相等称为结,又称同秩,则取平均秩次。

一般来说,秩就是该组数据按照升序排列之后,每个数据的位置。

1.单个样本的非参数检验 卡方检验(Chi-Square过程)

用卡方检验来检验定性变量的几个取值(分类数据,或类别)所占比例是否和理论的比例没有统计学差异。检验分类变量的分布

适合于定性数据及频数资料的分析

要求样本足够大,要求样本容量一般大于50; 应用领域

如病人经治疗后治愈、好转、有效和无效的人数总的说来是否相同(实为治愈、好转、有效和无效的概率或机会是否相同)成绩优、良、中、差的学生人数是否相同 赞同某种观点的人数是否达到80%,等等。

比如在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。Chi-Square检验的基本思路

先按照已知总体的构成比例分布,计算出样本中定性数据(即各类别)的期望频数然后求出观测频数和期望频数的差值,最后计算出卡方统计量 利用卡方分布求出P值,假设检验的H0是样本中某指标的比例与已知比例一致 得出检验结论

2.二项检验(Binomial过程)检验二项分类变量分布

用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一刀两断。

Binomial过程对二项分类变量的单个样本作检验,推断总体中两个分类数据的比例是否分别为π和(1-π)应用领域

射击时,击中与未击中;学生成绩,及格与不及格;疾病诊断,阴性与阳性;硬币,正面与反面;人群性别,男和女;产品质量,合格和不合格 定量数据、符号检验(SING TEST)与Binomial过程

定量数据:大样本;或小样本,总体服从正态分布,总体方差已知; 参数检验:单个样本的均值检验

定量数据,不满足参数检验的条件,且无适当的变量变换方法解决此问题;

极度偏态,或个别数值偏离过大;

一端或两端存在不确定数值

3.游程检验(Runs过程)

Runs过程借助样本序列的顺序推断总体序列的顺序是否是随机的,属随机性检验 二分类数据和定量数据(连续数据)均可

对于一个取两个值的分类变量,游程检验方法是检验这两个值的出现是否是随机的。游程检验还可以用于某个连续变量的取值小于某个值及大于该值的个数(类似于0和1的个数)是否随机的问题 游程检验的作用

1、检验总体分布是否相同

将从两个总体中独立抽取的两个样本的观察值混合后,观察游程个数,进行比较。

2、检验样本的随机性

将取自某一总体的样本的观察值按从小到大顺序排列,找出中位数,分为大于中位数的小于中位数的两个部分。用上下交错形成的游程个数来检验样本是否是随机的。应用范围

生产过程是否需要调整,即不合格产品是否随机产生; 奖券的购买是否随机;

期货价格的变化是否随机等等。

若事物的发生并非随机,即有某种规律,则往往可寻找规律,建立相应模型,进行分析,作出适宜的决策。

当样本按某种顺序排列(如按抽取时间先后排列)时,一个或者一个以上相同符号连续出现的段,就被称作游程 ;

4.(l-Sample K-S过程)

柯尔莫诺夫-斯米尔诺夫检验,考察某个连续性变量是否符合理论分布 利用样本数据推断总体是否服从某种分布

可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。数据要求:定量数据,Scale

5。

独立样本的非参数检

检验两个或多个独立样本所在总体是否相同

在不了解总体分布的情况下,通过分析样本数据均值或中位数的差异,推断样本来自的两/多个独立总体的分布存在的显著性差异。Independent Samples过程:主要用于检验两个独立样本所在总体分布是否相同 K Independent Samples过程:主要用于检验多个独立样本所在总体分布是否相同 界面上基本相同

(1)两个独立样本的非参数检验

含义:由样本数据,推断两个独立总体的分布是否存在显著差异(或两样本是否来自同一总体)分析对象:定量数据或定序数据 对分布的形状不加考虑

分布形状相同或类似的两个总体分布位置比较,可以简化地理解为两总体中位数的比较 应用范围

两种训练方法中哪一种更出成绩 两种汽 油中哪一个污染更少 两种市场营销策略中那种更有效

与独立样本t检验的区别

对于定量数据,如果方差相等,且服从正态分布

两个独立样本的非参数检验的过程

定序数据;对于定量数据,不满足两个独立样本t检验的条件

曼-惠特尼U检验(Mann-Whitney U)

为检验两总体的中位数是否相等,常用Mann-Whitney U 检验,或称Wilcoxon秩和检验(Wilcoxon rank sum test);

这两种方法是独立提出的,检验结果完全等价的; 分析步骤

建立检验假设,确定显著性水平α :

H0:两个总体的分布位置相同,即高中生和大学生的每周平均上网时间的总体分布相同;

H1:两个总体的分布位置不同,即高中生和大学生的每周平均上网时间的总体分布不同。或:

H0:M1=M2;

H1:M1>M2

2、编秩,将两组数据由小到大统一编秩,编秩时如遇有相同数据,取平均秩次。

3、求秩和,两组秩次分别相加。

4、确定统计量

若两组样本容量相等,则任取一组的秩和为统计量;

若两组样本容量不等,则以样本样本容量较小者对应的秩和为统计量。

5、查表确定P值,作出推断结论。若P>α,不能拒绝原假设。

若则P<α,拒绝原假设,认为两总体的分布不相同。

(2)多独立样本非参数检验

对三个或三个以上的总体的均值是否相等进行检验,使用的方法是单因素方差分析 ; 单因素方差分析过程需要假定条件,F检验才有效; 有时候所采集的数据常常不能满足这些条件,K Independent Samples过程 K Independent Samples过程

含义:由样本数据,推断多个独立总体的分布是否存在显著差异(或多个样本是否来自同一总体)分析对象:定量数据或定序数据 对分布的形状不加考虑

分布形状相同或类似的多个总体分布位置比较,可以简化地理解为多个总体中位数的比较。应用范围

各城市儿童身高分布一致吗?

不同收入的居民存(取)款金额分布一致吗?

电信公司人力资源部门比较3所大学雇员的管理业绩是否存在差异? 检验方法

Kruskal-Wallis H :克鲁斯卡尔-沃利斯单因素方差分析最常用,原理同Wilcoxon检验 多个样本间的两两比较 多组独立样本;

每组5个观察值,样本量小,分布类型未知;

考虑采用秩转换的非参数检验方法——Kruskal-Wallis秩和检验。

(3)两/多个配对样本非参数检验

检验两个或多个配对样本所在总体位置是否相同

在不了解总体分布的情况下,通过分析两/多个配对样本,推断样本来自的两/多个总体的分布是否存在显著性差异。Related Samples过程:主要用于检验两个配对样本所在总体分布是否相同 K Related Samples过程:主要用于检验多个配对样本所在总体分布是否相同 界面上基本相同

两个配对样本的非参数检验

含义:由样本数据推断两配对总体分布是否存在显著差异。数据要求

两组配对的样本数据;

两组数据的样本容量相同,先后次序不能任意改变,一一对应; 统计分析步骤

提出基本假设

H0:两配对总体分布无显著差异 H1:两配对总体分布有显著差异 统计决断

P值>α,不能拒绝原假设

P值<α,拒绝原假设

多个配对样本非参数检验

含义:由样本数据推断多个配对总体分布是否存在显著差异。

数据要求:多组配对的样本数据,多组数据的样本容量相同,先后次序不能任意改变,一一对应; 应用范围

三种促销形式的销售额分布一致吗? 收集乘客对多家航空公司是否满意的数据,分析航空公司的服务水平是否存在显著差异 评委打分一致吗? 三种检验方法

Friedman M检验:最常用

Kendall W检验 :和谐系数检验

Cochran Q:要求样本数据为二分类数据(1-满意

0-不满意)检验方法的选择

1)单个样本:若来自正态总体,可用t检验,若来自非正态总体或总体分布无法确定,可用二项检验(二项检验)2)配对样本:

二分类变量,可用McNemar检验;

连续型变量,若来自正态总体,可用配对t检验,否则可用Wilcoxon符号秩和检验。

3)两组独立样本:连续型变量,若来自正态总体,可用t检验,否则,可用 Wilcoxon秩和检验;

二分类变量或无序多分类变量,可用卡方检验;

有序多分类变量,宜用Wilcoxon秩和检验。4)多组独立样本

连续型变量值,来自正态总体且方差相等,可用方差分析;否则,进行数据变换使其满足正态性或方差齐的要求后,采用方差分析;数据变换仍不能满足条件时,可用Kruskal-Wallis秩和检验。

二分类变量或无序多分类变量,可用卡方检验。

有序多分类变量宜用Kruskal-Wallis秩和检验。

第7章 相关分析 概念

相关关系反映出变量之间虽然相互影响,具有依存关系,但彼此之间是不能一一对应的。例如,学生成绩与其智力因素、各科学习成绩之间的关系、教育投资额与经济发展水平的关系、社会环境与人民健康的关系等等,都反映出客观现象中存在的相关关系。相关关系的类型

1)根据相关程度的不同,相关关系可分为完全相关、不完全相关和无相关。2)根据变量值变动方向的趋势,相关关系可分为正相关和负相关。3)根据变量关系的形态,相关关系可分为直线相关和曲线相关。4)根据研究变量的多少,可分为单相关、复相关。相关分析的作用

1)判断变量之间有无联系

2)确定选择相关关系的表现形式及相关分析方法 3)把握相关关系的方向与密切程度

4)相关分析不但可以描述变量之间的关系状况,而且用来进行预测。5)相关分析还可以用来评价测量量具的信度、效度以及项目的区分度等 相关系数

相关系数是在直线相关条件下,说明两个变量之间相关程度以及相关方向的统计分析指标。相关系数一般可以通过计算得到。作为样本相关系数,常用字母r表示;作为总体相关系数,常用字母ρ表示。相关系数的数值范围是介于–1与 +1之间(即–1≤ r ≤1),常用小数形式表示,一般要取小数点后两位数字来表示,以便比较精确地描述其相关程度。

两个变量之间的相关程度用相关系数r的绝对值表示,其绝对值越接近1,表明两个变量的相关程度越高;其绝对值越接近于0,表明两个变量相关程度越低。如果其绝对值等于零1,则表示两个变量完全直线相关。如果其绝对值为零,则表示两个变量完全不相关(不是直线相关)。

相关系数的注意事项

1)相关系数只是一个比率值,并不具备与相关变量相同的测量单位。2)相关系数r 受变量取值区间大小及样本数目多少的影响比较大。

3)来自于不同群体且不同质的事物的相关系数不能进行比较。4)对于不同类型的数据,计算相关系数的方法也不相同

1.简单相关分析的基本原理

简单相关分析是研究两个变量之间关联程度的统计方法。它主要是通过计算简单相关系数来反映变量之间关系的强弱。一般它有图形(散点图)和数值(一方面应观察相关系数的大小,另一方面,应观察概率P值,其原假设为**不相关)两种表示方式。简单相关系数

1)皮尔逊(Pearson)相关系数

常称为积差相关系数,适用于研究连续变量之间的相关程度。例如,收入和储蓄存款、身高和体重等变量间的线性相关关系。注意Pearson相关系数适用于线性相关的情形,对于曲线相关等更为复杂的情形,系数的大小并不能代表其相关性的强弱。2)Spearman等级相关系

Spearman等级相关系数是用来度量顺序水准变量间的线性相关关系。它是利用两变量的秩次大小作线性相关分析,适用条件为:

① 两个变量的变量值是以等级次序表示的资料;

一个变量的变量值是等级数据,另一个变量的变量值是等距或比率数据,且其两总体不要求是正态分布,样本容量n不一定大于30。

从斯皮尔曼等级相关适用条件中可以看出,等级相关的应用范围要比积差相关广泛,它的突出优点是对数据的总体分布、样本大小都不做要求。但缺点是计算精度不高。3)Kendall’s等级相关系数

它是用于反映分类变量相关性的指标,适用于两个变量均为有序分类的情况。这种指标采用非参数检验方法测度变量间的相关关系。它利用变量的秩计算一致对数目和非一致对数目。

2.偏相关分析的基本原理

方法概述

简单相关分析计算两个变量之间的相互关系,分析两个变量间线性关系的程度。但是现实中,事物之间的联系可能存在于多个主体之间,因此往往因为第三个变量的作用使得相关系数不能真实地反映两个变量间的线性相关程度。基本原理

偏相关分析是在相关分析的基础上考虑了两个因素以外的各种作用,或者说在扣除了其他因素的作用大小以后,重新来测度这两个因素间的关联程度。这种方法的目的就在于消除其他变量关联性的传递效应。3.距离分析的基本原理

简单相关分

常用统计方法(SPSS)期末考试题型总结

第一篇:常用统计方法(SPSS)期末考试题型总结 SPSS期末考试题型总结 一、单样本t检验(单个正态总体的均值检验与置信区间)...
点击下载
分享:
最新文档
热门文章
    确认删除?
    QQ
    • QQ点击这里给我发消息
    微信客服
    • 微信客服
    回到顶部