相关分析研究的是两个或以上随机变量间的相关关系的分析。与回归分析不同,相关分析侧重的是变量间的相关特性,但不能说明变量间可相互依赖并进行预测,比如吃冰淇淋与肥胖之间的相关分析。
IBM SPSS Statistics可进行双变量、偏相关性与距离的相关分析。那么,以上三种相关分析有什么不同?接下来,我们通过一些例子详细讲解一下。
一、双变量相关
双变量相关,顾名思义,研究的是两个变量间的相关关系,比如客流量与销售额的相关关系。双变量相关可使用散点图或双变量相关分析法进行分析。
比如图2所示的客流量与销售额的散点图,从数据的分布看到,客流量与销售额存在着正相关的关系。
双变量相关分析检验的是两个变量间相关系数的大小,SPSS中可采用皮尔逊、肯德尔、斯皮尔曼相关系数进行检验。
相关系数r的值位于-1与1之间,其绝对者越接近于1,说明两个变量间的相关性越强。正的相关系数表示变量呈现正相关,负的相关系数表示变量呈现负相关。
从本例的分析结果看到,销售额与客流量之间存在着强相关关系。
二、偏相关
偏相关分析,是在变量间存在着共线性的前提下使用的。由于共线性影响,变量之间可能会呈现高度相关,此时,就需要将引起共线性的变量剔除出来,作为控制变量。
比如,在本例中,将客单价作为控制变量,对销售额与客流量进行偏相关分析。
在零阶偏相关分析(等同两变量相关分析)中,看到销售额与客流量存在着强相关关系(相关系数达到0.92)。
而在控制客单价的前提下,销售额与客流量的相关系数更是达到0.993,说明相关性非常强。
三、距离相关
两变量相关与偏相关都是研究变量之间的相关关系,但距离相关则有点不同,其研究的是变量间的相似性,也就是变量之间关系的“亲疏”。
距离相关可用于研究个案或变量间的相似性。在本例中,我们运用SPSS距离分析进行了购买金额、购买数量与浏览页面数的变量分析。
从距离分析得出的相似性矩阵看到,购买数量与购买金额之间存在着较高的相似性(值越接近于1,越相似)。
四、小结
综上所述,SPSS相关分析可进行双变量、偏相关性与距离的相关分析。其中,SPSS双变量相关研究的是两个变量间的相关关系;偏相关分析是在设定控制变量的前提下,研究两个变量间的相关关系;距离分析研究的是变量之间的相似性。
如需获取以上分析方法更详细的讲解,可前往城东书院网站搜索浏览。