我们在日常生活中常常需要估算个案间或变量间的相似程度,这时候我们可以采用计算个案间或变量间的距离的方法即距离分析。需要注意的是,距离分析的结果并不会给出显著性值,只是给出个案间或变量间的距离的大小,然后由我们自行灵活地判断其相似程度或不相似程度。SPSS中提供了距离分析的功能,接下来,通过实例向大家展示如何用SPSS进行距离分析。
一、个案间距离分析
假设某超市在A、B、C、D、E、F、G七个不同的地方开了七家分店,获取到了每个分店六月份牙膏、牙刷、毛巾、浴巾四种商品的销量(数据仅供示例,不具参考价值),现在想要分析七家分店销售情况的相关性。
第一步,打开SPSS,导入数据。打开SPSS,点击最上方的文件选项,在文件菜单栏中点击导入数据。SPSS支持Excel、CSV、文本等多种格式的数据,选择数据对应的格式,找到目标数据文件即可导入数据。
第二步,距离分析。成功导入数据后,点击最上方的分析选项,在分析菜单栏中找到相关中的距离选项。
点击距离选项后会弹出距离分析的设置窗口。在窗口的左边罗列了数据中所有的个案名称和变量名称,上面的是个案,下面的是变量。在计算距离中可选择个案间分析或变量间分析。现在我们需要分析的是七家不同分店的相关性,即个案间的相关性,选择个案间即可。
我们将四个商品变量导入窗口右边的变量框中,将个案导入到右边的个案标注依据中,然后选择非相似性。如果你只需要分析不同个案在某一变量上的相关性那么只需导入一个变量即可。
然后点击测量,在弹出的测量窗口中进行更详细的设置。SPSS提供了多种测距方案,包括欧式距离、平方欧式距离、切比雪夫距离等,这里我们选择欧式距离。窗口下方的标准化选择z得分。
设置完成后,点击继续,回到距离窗口,点击确定后就可以在弹出的输出窗口中看到距离分析的结果了。
分析结果一共有两个表格。第一个表格是“个案处理摘要”,这个表格给出了参与此次距离分析的个案的情况摘要,我们一共分析了七家分店,那么有效的个案数就是7。
第二个表格是“近似值矩阵”,这个表格详细的给出了不同个案在不同变量方面的相似情况。需要注意的是,在表格的最下方标注了“这是非相似矩阵”,这是因为我们在设置距离分析时选择了非相似测量,表格中的数字越大表示相关性越低,数字越小表示相关性越高。
当然,我们也可以选择相似测量。
二、变量间距离分析
还是同样的数据,现在我们想分析一下,不同商品的销量间是否有相关性,例如牙膏与牙刷的销量,毛巾与浴巾的销量是否有关,此时我们可以采取变量间距离分析。
我们只需要更改上述步骤中的两个地方即可。第一个地方是距离窗口中,选择变量间。这里我将非相似性改成了相似性,给大家展示一下选择相似性测量后的结果。
第二个地方是在测量窗口中,在标准化一栏中选择无,并勾选下方的“按变量”。完成更改后,点击确定即可得到分析结果。
在测量结果中我们可以看到,第二个表格下方标注了“这是相似性矩阵”,即数值越大相关性越高,数据越小,相关性越低。仔细观察数据我们可以看到,牙膏与牙刷间的数值、毛巾与浴巾间的数值均达到了0.9以上,表明牙膏与牙刷、毛巾与浴巾的销量有一定的关系。
三、总结
以上就是如何用SPSS进行距离分析的方法了,并且以表格的形式直观地给出分析结果,方便大家做后续分析。SPSS中还提供了多种不同的距离分析方法,大家使用时可以根据实际情况灵活选择。