在《如何使用SPSS进行一元线性回归分析》这篇文章中,我们已经详细学习了数据分析软件IBM SPSS Statistics的一元线性回归分析的设置方法。接下来,本文将针对分析过后的数据进行详细解读。
在解读过程中,我们需要求得方程式的系数,并判断系数的拟合程度、方程式的统计学意义。
一、使用的数据
本文分析所用的数据是一组包含客流量与销售额的数据,研究的是以客流量为自变量、销售额为因变量的线性关系。
二、解读检验结果
1.模型拟合效果
模型摘要中的R方是判定系数,其数值越接近于1,表明方程的拟合优度越好,一般需要大于0.6。
从如图2所示的模型摘看到,求得的一元线性回归方程的R方为0.839,说明本例分析所得的回归方程拟合效果良好。
在判定回归方程拟合优度良好的情况下,查看ANOVA分析中的“回归模型”方差分析。如图3所示,“回归模型”的显著性值为0.00<0.05,说明该“回归模型”具有显著的统计学意义,也就是说,客流量与销售额之间存在着显著的线性回归关系。
2.构建模型表达式
在判定回归模型具有显著统计学意义的前提下,进一步检验求得的系数是否通过T检验。该T检验的原假设为求得的回归系数不具有统计学意义。
如图4所示,可以看到回归系数(客流量对应的系数)的显著性数值为0.00<0.05,拒绝原假设,也就是说方程的回归系数具有统计学意义,可构建y=12.821x-2644.658的一元线性回归方程。
3.残差相关性分析
通过上述的分析,我们已经可以认为构建的一元线性回归方程y=12.821x-2644.658具有统计学意义,但是否可用于预设因变量的值,还需要通过残差相关性分析。如果残差存在自相关的话,模型的预测准确度将会不高。
如图5所示,模型的D-W值(德宾-沃森值)为2.060,查阅德宾-沃森表得到,样本量n=198(采用200样本量D-W值),控制变量数量k=1,其下临界值LD=1.664、上临界值UD=1.684。
根据D-W值的判定规则,本例的D-W值符合“如果UD<dw4-ud ,则接受零假设,残差不存在一阶正自相关。dw越接近2,判断无自相关性把握越大。”说明模型的残差不存在自相关。
另外,再通过残差直方图看到,残差的分布趋近于正态曲线的分布。
再结合正态P-P图分析,可以看到,数值的分布近似于直线,说明残差的正态性良好。
在满足残差无自相关性、服从正态分布的前提下,说明本例构建的一元线性回归方程具有良好的预测性,可通过为自变量代入数值,求得预测的因变量。
三、小结
综上所述,在使用IBM SPSS Statistics构建一元线性回归方程时,需要通过判定系数R方判断回归方程的拟合优度,并检验回归方程、方程系数的是否具有统计学意义。
在回归方程具有统计学意义的前提下,需进一步通过分析残差的自相关性、正态性来判断回归方程的预测效果。