多元线性回归是较为简单的回归分析,用以评价因变量与多个自变量之间是否存在简单线性关系,人工进行多元线性回归分析计算非常繁琐,借助统计分析软件则可以显著提高效率,如IBM SPSS Statistics,使用SPSS进行多元线性回归需要做哪些检验,多元线性回归分析步骤是怎样的,本文将向大家作简单介绍。
一、多元线性回归需要做哪些检验
进行多元线性回归分析,首先要求因变量是连续变量,且自变量之间相互独立,不相互影响。
然后需要对自变量进行正态分布检验,异常数据检验和多重共线性检验,由于本文采用了随机生成的数据,符合正态分布,所以这里省略正态分布检验,感兴趣的读者可以登录SPSS中文网站:查找学习。
首先录入数据如图1所示。
然后点击图形,旧对话框,箱图。
选择简单箱图,然后勾选单独变量的摘要,点击定义,进行箱图绘制,然后在弹出的对话框中将VAR00001,VAR00002,VAR00003指定为箱表示变量,点击确定。
箱图如图4所示,如果有异常数据,箱图会进行标记提示,本文数据没有异常数据。
接下来我们进行共线性检测,如果自变量之间本身为线性关系,那么进行多元线性回归就没有意义,我们点击分析,回归,线性,进入回归分析功能,如图5所示。
我们指定因变量为VAR00004,自变量为VAR00001,VAR00002,VAR00003。
然后点击统计,在弹出的窗口选择,共线性诊断。关于共线性诊断结果我们将在第三小节中介绍。
二、多元线性回归分析步骤
我们继续第一小节步骤,进行多元线性回归分析,选定共线性诊断以后,我们回到图8所示界面,点击图,将DEPENDNT加入Y轴,将*ADJPRED加入X轴,勾选直方图,正态概率图,点击继续。
回到图9所示主界面,点击确定,SPSS将进行多元线性回归分析,输出结果,并绘制图像,辅助展示回归结果,关于结果解释我们在第三小节中介绍。
图10是回归后,残差的预计概率和实测概率图,实测值越贴近直线,线性程度越高。
三、多元线性回归分析结果解读
结合图11,我们首先观察到SPSS将全部变量输入,没有剔除变量,然后我们观察模型摘要,一般以R反应线性相关程度,R越接近1,线性相关程度就越高,我们以调整后R方表示自变量对因变量的解释程度,即通过多元线性回归分析自变量可以影响因变量的99.7%。
然后我们分析ANOVA显著性,如果此值小于0.05,则证明线性回归分析不具有统计学意义,如果此值大于0.05,说明线性回归分析具有统计学意义。
然后我们查看图12回归结果2,线性回归方程为:4.946*VAR00001+4.172*VAR00002+3.074*VAR00003-8.455。共线性统计VIF均小于10,提示多元共线性检验通过。多元线性回归分析有效。
多元线性回归需要做哪些检验?包括数据是否呈正态分布,数据是否存在异常值,以及多元共线性检验;完成上述检验后,多元线性回归步骤比较简单,正确地分析结果,给出结论即可。