对于统计学工作,确定自变量对因变量的影响程度是非常重要的,工作人员预想或进行实验的所有自变量可能并非都显著的影响因变量。因此如何选择出那些对因变量影响巨大的自变量,是工作人员需要解决的首要问题。SPSS提供了逐步回归分析的功能,借助于此功能,用户可以从可能影响因变量的众多自变量中,筛选出对因变量影响大的自变量,从而优化条件,获取更高的经济效益。
SPSS实现逐步回归的基本过程是,将变量一个一个引入,对引入的变量逐个进行检验,逐步剔除影响最不显著的自变量,直至将全部数据计算完毕,构造最优的回归方程。
1.数据录入
打开SPSS软件,录入实验数据,如图1所示。
然后打开图2所示界面,对变量属性进行设置。将变量名称分别设置为X1,X2,X3,X4,X5。
2.进行逐步回归分析
点击分析,回归,线性,选入需要分析的变量,将X5添加入因变量中,将X1-X4添加入自变量中,然后在方法栏中选“逐步”,单击选项按钮,在“使用F的概率”中的进入输入0.1,除去输入0.11。
表示当候选变量中最大F值的P值小于或等于0.1时,引入相关变量。在引入方程的变量中,最小F值的P值大于或等于0.1时,则剔除该变量。
点击确定运行逐步分析。
3.逐步分析结果解读
变量逐步回归分析结果我们需要关注图5所示的两个表格,首先排除的变量X1和X3,其显著性分别为0.724和0.626,远远大于0.05,不能接受相关假设,认为X1,X3和X5不相关。
在模型摘要中,预测变量为X2和X4时,R值为1,呈强烈线性相关关系,认为X2和X4与X5之间呈线性相关关系。
实际上本文数据X5=X2+2*X4,与SPSS逐步分析结果相同。
逐步回归分析在优选配方,经济学统计等方面应用非常广泛,借助于SPSS的逐步回归分析功能,统计工作者可以大大节省优选变量的的时间,提高工作效率。