在许多数据分析案例中,往往有许多种不同变量或因素共同影响最终结果,为了探究多变量或因素对实验结果的影响,我们常常会对数据进行主成分分析,将具有一定相关关系的变量重新组合划分为几组互不相关的新变量,作为影响结果的几种主成分,即新的综合指标来分析结果。本节将会带大家学习如何使用SPSS进行主成分分析。需要注意的是,进行主成分分析要满足两个条件:变量是连续变量或有序分类变量,且变量之间存在线性相关关系。
一、打开数据文件
本例中我们使用的是IBM SPSS Statistics 28.0.0.0 Windows版本。本例子以种植了玉米、花生、甘蔗三种不同作物的土壤成分为例,探究种植有不同作物的土壤成分综合评价。
如图1所示,展示的是三种不同的土壤中各主要成分的具体含量。需要注意,示例数据中的土壤成分变量使用的是字符串值,我们需要先将字符串转换为数值,才能进行下一步操作。
二、进行主成分分析
点击菜单栏中的“分析”,选择“降维”中的“因子”分析。
在弹出的选项框中,将变量数据栏全部加入到右侧变量的方框。
然后设置右侧栏中的选项,需要更改的各项设置如下:
更改完设置后点击确定,进行数据分析。
三、结果分析
(1)相关矩阵表明,各项指标之间具有强相关性。一般来说,如果相关型矩阵中显示的相关系数的数值大于等于0.3,我们就可以认为变量之间存在较好的线性相关性。通过线性相关性的验证,表明这几种变量的指标信息之间存在重叠,因此适合采用主成分分析法。
(2)总方差解释表格
由表格可以看出,初始特征值>1的成分有2个,因此可以提取出2个主成分,来作为新的综合指标来分析土壤肥力状况。这两个成分记为主成分1、主成分2,从表格数据得到他们的初始特征值依次为4.992、3.008;方差贡献率依次为62.399%、37.601%,总和为100%。
表中可知主成分提取载荷平方和分别为4.992,3.008,因此求算术平方根,算出主成分1、2的提取载荷为(仅举例列出三位小数,计算时应更加精确)2.234、1.734。
这两项数据在后续分析中要用到,在此需要记录。
(3)点开之前录有数据的SPSS界面,在最右边可以看见新生成有两列数据,即主成分因子得分(FAC),分别为因子得分1、因子得分2。
(4)计算各主成分得分。
主成分1得分F1=因子得分1*主成分1提取载荷,以此类推F2。计算得出主成分得分F1与F2。
最后计算综合评价得分Y,即按照各主成分的方差贡献率对各主成分得分进行加权平均:综合评价得分Y=(F1*主成分1方差贡献率+F2*主成分2方差贡献率+F3*主成分3方差贡献率)/(主成分1、2、3的方差贡献率总和)(由方差解释表中可以得到主成分的方差贡献率),得到:
可以看出,在三种土壤中,种植甘蔗的土壤综合评价得分最高,其次是花生,最后是玉米。以上就是本期的相关SPSS教程了,欢迎访问城东书院网站,掌握更多软件技巧。