IBM SPSS Statistics的多元线性回归研究的是多个自变量与单个因变量的回归关系,与一元线性回归方程相比,多元线性回归方程更有实际性意义。因在实际的研究中,一个现象总是由多个因素影响,而很难局限于单因素影响。
如果您已经学习过一元线性回归方程,那么,多元线性回归将会变得非常简单,实际上,多元线性回归方程只是在一元线性回归方程的基础上,增加多个自变量。
一、数据准备
接下来,我们以一组包含客流量、销售额与销售量的数据组为例,演示一下多元线性回归方程的分析过程。
二、线性回归分析
与一元线性回归方程相同,多元线性回归方程使用的是SPSS的线性回归分析方法。
三、变量设置
只是在变量设置的过程中,多元线性回归方程会加入多个自变量。在本例中,如图3所示,我们将客流量与销售量都设置为自变量,以研究两者与销售额之间的回归关系。
在统计量的设定上:
1. 为了检验回归方程系数的显著性,需勾选回归系数中的“估算值”并将其置信区间设定为95%(当然,您也可以放低要求设为90%)。
2. 为了检验回归模型的拟合优度,需勾选“模型拟合”
3. 同时勾选“描述”统计量,了解数据的基本特征
在图标的设定上,可同时勾选“直方图”与“正态概率图”,了解数据的残差是否服从正态分布,以检验回归方程的显著性。
三、结果解读
完成以上设置后,我们先来看一下销售额的标准化残差直方图,可以观察到,销售额的标准化残差服从正态分布,大部分的标准化残差分布在-2到2之间。
从正态P-P图看到,预期累积概率与实测累积概率的分布趋近于一条直线,也说明了销售额的残差服从正态分布,满足了线性回归模型对于正态性的要求。
在变量相关性的检验上,如图8所示,销售额与客流量、销售量之间都存在着显著的相关性。
在模型拟合优度的检验上,其调整后R方数值为0.976,说明模型的拟合优度高。
在满足回归方程正态性要求、回归方程拟合优度高的前提下,观察回归模型的系数检验显著性。如图10所示,回归方程的客流量与销售量系数均显著,但常量系数不显著。
常量系数检验不显著,说明其数值对回归方程的影响意义不大,可建立无截距的回归方程。根据回归结果列出以下方程:y=1.74x1+53.265x2
四、小结
综上所述,在SPSS中构建多元线性回归方程的方法与一元线性回归方程相似,只是在自变量的设置上稍有区别,SPSS一元线性回归方程仅包含一个自变量,而多元线性回归方程包含二个或以上的自变量。
另外,与一元线性回归方程相同,多元线性回归方程需满足线性、正态性、方差齐性等要求。