共线性,指的是线性回归方程中自变量之间存在着高度相关关系而使得方程的预测结果出现偏差。
当模型存在严重共线性时,OLS估计量虽仍可能出现较好的统计显著性,但实际上其预测结果已经失去统计意义。这是因为,自变量的共线性会使参数估计值的方差增大,而变大的方差会增大随机误差项,使预测失去意义。
那么,怎么在IBM SPSS Statistics中检验变量间是否存在共线性?接下来,一起通过实例详细学习一下吧。
一、数据准备
本例使用的是一组包含客流量、销售额与销售量的数据。
二、线性回归共线性分析
共线性检验是用于线性回归方程的变量检验,因此,需在构建线性回归方程时设置共线性检验。
如图2所示,依次单击分析-回归-线性回归选项。
在线性回归的设置中,将销售额设置为因变量,将客流量、销售量、所处区域设置为自变量。
为了检验客流量、销售量、所处区域这三个自变量之间是否存在着共线性。如图4所示,需打开统计设置面板,勾选“共线性诊断”。
三、结果解读
线性回归方程的共线性检验设置很简单,但其结果解读就显得复杂一些。
如图5所示,在系数检验表中,可通过共线性统计中的容差与VIF(方差膨胀因子)判断自变量的共线性。
容差与VIF互为倒数关系,当容差(tolerance)<=0.1,说明自变量间共线性严重。当VIF值小于3时,没有共线性问题;当VIF值大于3小于10时,有中等程度的共线性;当VIF值大于10则有很严重的共线性问题。
从图5的结果得出,客流量与销售量之间存在着中等程度的共线性,可能会影响回归方程的预测结果。
除了看容差与VIF值外,还可以参考共线性诊断中的特征值与条件指标。当特征值约等于0、条件指标的值大于10、方差比例接近1时(其中一项符合即可),均可说明存在比较严重的共线性。
根据图6所示的共线性诊断结果,得出以下结论:
1. 维度3和4的特征值约等于0,说明存在比较严重的共线性。
2. 维度3的条件指标接近10,维度4的条件指标大于10,说明存在比较严重的共线性。
3. 客流量与销售量维度4的方差比例接近1,说明存在较严重的共线性。
四、小结
综上所述,进行SPSS线性回归分析时,需要先对自变量进行共线性检验,确保自变量之间不存在高度相关的关系,避免影响到回归模型的预测准确性。
在解读共线性检验结果时,可查看容差、VIF、特征值、条件指标、方差比例的值,并根据不同指标设定的共线性标准判断自变量之间的共线性。