您当前的位置:首页 > 计算机 > 软件应用 > 采集运算

IBM SPSS Statistics进行多自变量的多元线性回归分析

时间:02-01来源:作者:点击数:

IBM SPSS Statistics的多元线性回归研究的是多个自变量与单个因变量的回归关系,与一元线性回归方程相比,多元线性回归方程更有实际性意义。因在实际的研究中,一个现象总是由多个因素影响,而很难局限于单因素影响。

如果您已经学习过一元线性回归方程,那么,多元线性回归将会变得非常简单,实际上,多元线性回归方程只是在一元线性回归方程的基础上,增加多个自变量。

一、数据准备

接下来,我们以一组包含客流量、销售额与销售量的数据组为例,演示一下多元线性回归方程的分析过程。

图1:销售额与客流量数据
图1:销售额与客流量数据

二、线性回归分析

与一元线性回归方程相同,多元线性回归方程使用的是SPSS的线性回归分析方法。


图2:线性回归

三、变量设置

只是在变量设置的过程中,多元线性回归方程会加入多个自变量。在本例中,如图3所示,我们将客流量与销售量都设置为自变量,以研究两者与销售额之间的回归关系。

图3:变量设置
图3:变量设置

在统计量的设定上:

1. 为了检验回归方程系数的显著性,需勾选回归系数中的“估算值”并将其置信区间设定为95%(当然,您也可以放低要求设为90%)。

2. 为了检验回归模型的拟合优度,需勾选“模型拟合”

3. 同时勾选“描述”统计量,了解数据的基本特征


图4:统计量

在图标的设定上,可同时勾选“直方图”与“正态概率图”,了解数据的残差是否服从正态分布,以检验回归方程的显著性。

图5:图表
图5:图表

三、结果解读

完成以上设置后,我们先来看一下销售额的标准化残差直方图,可以观察到,销售额的标准化残差服从正态分布,大部分的标准化残差分布在-2到2之间。

图6:标准化残差直方图
图6:标准化残差直方图

从正态P-P图看到,预期累积概率与实测累积概率的分布趋近于一条直线,也说明了销售额的残差服从正态分布,满足了线性回归模型对于正态性的要求。

图7:正态P-P图
图7:正态P-P图

在变量相关性的检验上,如图8所示,销售额与客流量、销售量之间都存在着显著的相关性。

图8:变量相关性
图8:变量相关性

在模型拟合优度的检验上,其调整后R方数值为0.976,说明模型的拟合优度高。

图9:模型拟合优度
图9:模型拟合优度

在满足回归方程正态性要求、回归方程拟合优度高的前提下,观察回归模型的系数检验显著性。如图10所示,回归方程的客流量与销售量系数均显著,但常量系数不显著。

常量系数检验不显著,说明其数值对回归方程的影响意义不大,可建立无截距的回归方程。根据回归结果列出以下方程:y=1.74x1+53.265x2

图10:系数显著性
图10:系数显著性

四、小结

综上所述,在SPSS中构建多元线性回归方程的方法与一元线性回归方程相似,只是在自变量的设置上稍有区别,SPSS一元线性回归方程仅包含一个自变量,而多元线性回归方程包含二个或以上的自变量。

另外,与一元线性回归方程相同,多元线性回归方程需满足线性、正态性、方差齐性等要求。

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门