IBM-SPSS第21章主成分与因子分析主要内容第一节主成分分析第二节因子分析第三节主成分分析与因子分析的区别与联系第一节主成分分析主成分分析PrincipalComponentsAnalysis(1)定义从多个数值变量(指标)之间的相互关系入手,利用降维的思想,将多个变量(指标)化为少数几个互不相关的综合变量(指标)的统计方法。(2)基本思想数据的降维、数据的解释将原来众多具有一定相关性的指标,组合成一组新的相互无关的综合指标。从中选取几个较少的综合指标尽可能多的反映原来众多指标的信息。这种既减少了指标的数目又抓住了主要矛盾的做法有利于问题的分析和处理。主成分分析的关键是:计算综合指标主成分即综合指标,它在个体间的变异应该越大越好。(3)主成分的计算及性质1.主成分的确定方法①累计贡献率:当前k各主成分的累计贡献率达到某一特定值(一般采用70%以上)时,则保留前k个主成分②特征根:一般选取特征根≥1的主成分。2.几个相关的术语及统计量①特征跟(Eigenvalue)Var(Ci)=λi各主成分所提供的信息量多少,常用其方差的大小(即特征根λ)来衡量,λ愈大,该主成分提供的信息量就愈大,可见:λ1>λ2>…>λm。②主成分Zi方差贡献率计算式为:λi表示主成分Zi的方差在全部方差中的比重。这个值越大,表明主成分Zi综合原始变量信息的能力越强。③累计贡献率前k个主成分的贡献率之和为前k个主成分的累积贡献率,表示前k个主成分累计提取了原始变量多少的信息。主成分的性质(4)主成分分析的用途主成分评价主成分回归①主成分评价在进行多指标综合评价时,由于要求结果客观、全面,就需要从各方面用多个指标进行测量,但这样就会使得个观测指标间存在信息重叠,同时还存在量纲、类家室如何确定权重系数等问题。因此使用主成分分析方法进行信息的浓缩,并解决权重的确定等问题。优点:1、消除各指标不同量纲产生的影响;2、对于相互之间有相关性的指标,不存在信息的重叠。②主成分回归将计算出的主成分作为新的自变量,与应变量做多元回归分析。优点:主要解决自变量间的共线性问题,避免回归系数的不合理现象,揭示变量间的真实关系实例详解例21.1:某研究单位测得20名肝病患者4项肝功能指标(数据文件见“例21.1.sav”):转氨酶(x1)、肝大指数(x2)、硫酸锌浊度(x3)、甲胎球蛋白(x4),是做主成分分析。第二节第二节因子分析因子分析FactorAnalysis(1)定义因子分析(factoranalysis)是用来寻找那些隐...