回归分析spss步骤,本文会以研究客流量对销售额影响的问题为例具体演示spss操作步骤,同时,也会具体进行回归分析spss结果解读,并进一步讲解回归分析的其他类型,以帮助加深对回归分析的认识。
一、回归分析spss步骤
本文使用的是一组客流量和销售额的数据,用于构建客流量与销售额的线性回归分析,以研究客流量的变化对销售额的影响。
本例数据仅包含一个自变量与一个因变量,因此可构建简单的一元线性回归方程,依次单击spss的分析-回归-线性选项,进行线性回归分析。
第一步选择变量,分别将销售额、客流量添加到因变量、自变量选项中,以研究自变量客流量对因变量销售额的影响。
第二步,指定线性回归进入的方式,包括输入(自变量全部放进回归模型)、步进(按自变量贡献度、剔除与否等决定自变量是否放入回归模型)、除去(建立自变量模型后,根据条件剔除自变量)、后退(与除去相似,但后退采用逐次剔除自变量的方法)与前进(逐次添加自变量)五种方法。
由于本例分析的是简单的一元线性回归方程,可以按照默认选择“输入”。
第三步设置统计量,分别指定以下统计量:
1.回归系数,进行线性回归方程系数的计算,勾选“估算值”,可获得参数估计量。
2.模型拟合,了解模型的拟合度以及预测的准确度,可同时勾选“描述”统计数值,查看平均值、方差等。
3.残差,勾选“德宾-沃森(D-W)”检验,以了解残差是否存在自相关,检验模型是否具有统计学意义。
第四步,设置参考图表,比如标准化残差图中的“直方图”、“正态概览图”,用于辅助分析残差的自相关性、正态性,检验模型是否具有统计学意义。
第五步,如果在回归方程中需要设置常数项,需在“选项”设置中勾选“在方程中包括常量”。
二、回归分析spss结果解读
完成以上spss的设置后,即可进行运算获取结果,我们需要从模型拟合度、残差是否具有自相关来检验回归方程是否具有统计学意义,以及判断其预测的准确度。
a.模型拟合效果
模型摘要,求得的回归方程R方为0.839,R方数值越接近于1,说明方程的拟合优度越好,一般需要大于0.6。本例回归方程R方为0.839,说明本例分析所得的回归方程拟合效果良好。
ANOVA分析,回归模型的显著性值为0.00,小于0.05的置信空间,即说明有95%的概率拒绝原假设(原假设为客流量与销售额之间无回归关系),也就是说,客流量与销售额之间存在着显著的回归关系。
b.残差相关性分析
通过回归方程R方、ANOVA分析,可得知回归方程具有统计学意义,但模型是否具有准确的预测性,还需要通过残差相关性分析进一步确认。如果残差存在自相关的话,模型的预测准确度就不高。
查看模型摘要中的德宾-沃森值为2.060,查阅德宾-沃森表得到,样本量n=198(采用200样本量D-W值),控制变量数量k=1,其下临界值LD=1.664、上临界值UD=1.684。
而本例的德宾-沃森值为2.060,根据判定规则,本例回归方程符合“如果UD<dw<4-ud”。
残差直方图,可查看到残差的分布趋近于正态曲线的分布。
再结合正态P-P图分析,数值的分布近似与直线,说明残差的正态性良好。
在满足残差无自相关性、服从正态分布的前提下,说明该回归方程具有良好的预测性。
c.构建模型表达式
在判定回归模型统计学意义、残差无自相关性、残差满足正态分布的前提下,可求得回归方程的回归系数,从而构建回归方程。
系数分析表,客流量回归系数的显著性数值为0.00<0.05,有95%概率拒绝原假设;而常量系数的显著性为0.4,无法拒绝原假设。说明自变量回归系数具有统计学意义,而常量系数不具有统计学意义,可构建y=12.821x的一元线性回归方程。
三、回归分析有哪些类型
在上文的示例中,我们演示了简单的一元线性回归分析,那么,除此以外,回归分析还包含哪些类型呢?
回归分析包含了线性回归与非线性回归分析,其中:
1.线性回归分析,可分为一元线性回归分析(一个自变量X与因变量Y的关系)与多元线性回归分析(多个自变量与因变量Y的关系)
2.非线性回归分析,也称为曲线回归,根据因变量是定量变量或定性变量可分为Logistic回归、有序回归、Probit回归等。非线性回归分析由于模型未知,其分析情况会更为复杂,常需要借助图表归纳,或简化为多元线性回归来分析。
四、小结
以上就是回归分析spss步骤,回归分析spss结果解读的相关内容。本文重点演示了spss中的一元线性回归分析的步骤,其中会涉及到回归方程的共线性、残差相关性、残差正态性、方程拟合优度等指标的使用。