如何用spss做模糊聚类分析?我们可使用spss分类分析中的系统聚类分析法进行模糊聚类分析。模糊聚类分析的优缺点,其优点是在未知聚类种类的情况下,可结合相关知识探索分类,缺点是无确定的聚类结果,需结合相关知识分析。
一、如何用spss做模糊聚类分析
模糊聚类分析是一种引入模糊数学原理的聚类分析方法,包括系统聚类分析法与非系统聚类分析方法,spss可用于系统聚类分析,常用于分析一些模糊的数据分类问题,相比于k均值、两步聚类等,其结果拥有不确定性,可结合相关行业知识、以往的数据分析结果来确定聚类数量与结果。
接下来,我们以一组商品品类的各项指标数据为例,演示一下如何用spss做模糊聚类分析。
如图2所示,依次点击spss的分析-分类-系统聚类功能。
系统聚类分析是利用变量进行迭代距离分析的方法,因此,只需放入聚类分析变量即可分析,其主要的输出结果为冰柱图与树状图(谱系图)。如果要在图表中标注个案的名称,可将个案变量选入“个案标注依据”。
根据本例数据所分析的问题,如图4所示,将指标变量都选入“变量”列表框,将“地区”选入“个案标注依据”,以在图表中显示个案的名称。
系统聚类可在未知聚类数量情况下进行模糊聚类分析,但如果想要限制聚类的数量或事先已知大致的聚类数量,也可通过设置“统计”中“解的范围”来控制聚类数量。
系统聚类分析主要是依靠图表来总结聚类结果,默认会运算得出冰柱图,也可加入“谱系图”选项,谱系图又叫树状图,输出结果会更直观。
在聚类方法上,可选择“瓦尔德法”,并使用“平方欧式距离”测量区间,其他保持默认设置即可。
二、模糊聚类分析的优缺点
模糊聚类分析的优点是对于模糊的数据分析问题,比如产品的质量是很好、比较好、特别好,还是一般等模糊表述,可进行模糊化的聚类,也就是说,可在未知聚类情况、聚类数量等情况下,根据相关分析经验、行业知识等进行结果的解读。
比如图8的分析结果,可根据需要绘制Y轴参考线来确定聚类的数量,将不同账号分成三类、四类、五类,都可以根据分析者的经验调整。
但缺点也比较明显,如果无相关知识,或者研究的问题很新,无其他研究经验可帮助解读数据时,将很难进行聚类结果的确定,其分析结果不及k均值聚类、两步聚类分析清晰,需要进行其他的辅助分析以帮助解释分类结果。
三、怎么解读spss模糊聚类分析结果
接下来,我们继续进行spss模糊聚类分析结果的解读。在上文操作中,我们将聚类数量限制在2-6,因此,在分析结果中可查看到2-6个聚类的分析结果。
从图9的聚类成员结果看到,商品1在2-6个聚类都属于第一个聚类;商品2在2-3个聚类属于第一个聚类,在5-6个聚类属于第二个聚类,如此类推。
那么,到底要采用哪个聚类结果?我们需要进一步查看谱系图的结果。
如图10所示,可在谱系图上绘制Y轴参考线辅助分析。参考线与谱系图的横向线条交叉点即为一个聚类,查看该聚类延伸的商品,可判断该聚类是否合理,比如如果都是低价商品,说明该聚类合理。
四、小结
以上就是关于如何用spss做模糊聚类分析,模糊聚类分析的优缺点的相关内容。spss的模糊聚类分析可通过系统聚类分析方法运算,其分析结果具有模糊性,一般需要结合相关知识判断聚类结果的合理性,来进一步确定聚类的数目。