虽然很多数据都呈现线性相关的关系,但在实际研究中,更多的数据是呈现非线性相关的,对于这部分数据,就需要采用非线性回归的分析方法。
IBM SPSS Statistics非线性回归使用的前提是,我们已对数据作一定的分析,并已明确知道其符合具体哪种曲线,并可构建出曲线对应的模型表达式。这听起来还是比较难的,我们先来攻克下模型表达式的构建。
一、非线性回归
本次使用的是一组包含促销费用与销售额的数据,以探究促销费用与销售额之间的关系。
非线性回归属于SPSS的回归分析,可在分析菜单的回归方法中使用到。
如图3所示,SPSS非线性回归的一个重要内容是填入模型表达式,实际上,SPSS的非线性回归是采用迭代方法对设置的曲线模型进行拟合,因此,必须先确定其曲线模型的表达式。
二、运用散点图分析数据的分布
如果刚开始对数据的分布特点毫无头绪,可先使用SPSS的图表构建器,观察数据的分布特点。
如图5所示,选用散点图,并将销售额拖放到Y轴、促销费用拖放到X轴。注意,此时显示的散点图只是图例,需单击“确定”才能得出运算结果。
根据以上的散点图维度设置,可获得如图6所示的销售额与促销费用的散点图,可以看到,在较低促销费用时,销售额与促销费用呈现近乎线性的关系,但随着促销费用的提升,销售额的增加幅度变小。
三、运用曲线估算表达式
由于本例研究的是单个自变量与因变量的非线性关系,因此,可采用曲线估算的方法先得出曲线模型的表达式。
依次单击分析-回归-曲线估算,启用曲线估算分析法。
如图8所示,在曲线估算设置中,将销售额设为因变量、促销费用设为独立变量,并勾选线性、二次、复合、对数、指数模型。
运算结果如图9所示,对数方程的R方(衡量回归方程的拟合优度)为0.937,拟合程度很好,优于其他的方程式。
带拟合曲线的散点图,如图10所示,对数曲线模型拥有更优的拟合程度。
双击对数曲线,如图11所示,对数曲线对应的模型表达式可写为y=8.5558+6.442*log(X)。
四、小结
综上所述,IBM SPSS Statistics对于简单的单个自变量的非线性回归,可采用先观察散点图,后进行曲线估算的方式,获取曲线对应模型的表达式后,再进行后续的SPSS非线性回归分析。