在《详解SPSS两步聚类之参数设置》一文中,我们已经了解了两步聚类的优点、分析原理,以及参数设置的技巧。
在本节中,会对IBM SPSS Statistics聚类后的结果进行解读,其中会涉及到最终聚类的结果、聚类的质量、变量重要性、聚类特征的解读。
如图1所示,我们先来回顾下本例数据在参数设置面板中的详细设置。
一、数值结果
根据上述参数设置,得到如下的数值分析结果。
首先看到自动聚类结果,如图2所示为聚类的透视表结果,展示了不同聚类数目下的BIC、BIC变化量、BIC变化比例与距离测量比率。SPSS会自动综合以上指标的数值,得出最佳的聚类数目。
根据图2的自动聚类透视表结果,SPSS得出了如图3所示的一个3聚类的结果。其中聚类1包含69个个案,占总计34.8%;聚类2包含62个个案,占总计31.3%;聚类3包含67个个案,占总计33.3%。
二、图表结果
接下来,我们再来看看二阶聚类的图表结果。
如图4所示,在模型概要中,显示该模型执行了两步聚类,输入了6个变量,得到3个聚类。另外,其聚类质量为良好。
如图5所示,右击模型概要,选择“编辑”选项,打开模型查看器,可进一步查看其它的辅助视图。
如图6所示,在模型查看器的左侧包含了模型概要视图,右侧包含了预测变量重要性视图。而通过单击右侧视图下方的查看选项,可切换聚类大小、聚类特征等视图。
首先看到的是预测变量重要性视图,可以看到,星级是最为重要的变量、其次是销售额与销售量。
而从聚类大小看到,3个聚类的占比相似,最大聚类与最小聚类的比值为1.11。
如果想了解不同聚类的特征,可从如图8所示的聚类特征表中得到相关的信息。聚类特征表展示的是聚类与变量的交叉分析,其数值展示的是分类变量的分布或连续变量的中心点,由此可得出不同聚类的显著特征。
比如,聚类2是五星级占比100%,销售额、销售量、客流量中心点最大、所处区域为3(占比38.7%)的店铺类型。
三、小结
综上所述,SPSS的两步聚类分析解读,可先从BIC准则判断最佳的聚类数目,然后,再从模型概要得到聚类质量。
在确认聚类质量可接受的前提下,可通过模型查看器进一步解读聚类变量的重要性、聚类特征等。