SPSS决策树分析使用教程

时间：02-01来源：作者：点击数：2495

SPSS决策树分析是基于树的分类模型，它将个案分为若干组，或根据自变量（预测变量）的值预测因变量（目标变量）的值。它有易于理解、可以应用于小数据集、能够处理多输出的问题、对缺失值不敏感、效率高等优点。下面就讲解下SPSS决策树分析使用教程。

一、数据集准备

本例使用的是信用风险识别数据（来源Kaggle的项目），包括int_rate（贷款利率）、grade（贷款等级）、home（住房性质）、employment（职业）等八个指标，我们将通过SPSS软件使用这八个指标对数据个案进行决策树分析。

图1数据展示

二、决策树参数设置

点击SPSS主页顶部菜单栏“分析”-“分类”-“决策树”，即可打开决策树窗口。将flag加载到因变量文本框，将八个指标加载到自变量文本框。生长法选择CHAID（卡方自动交互检测），主要是利用卡方检测判断属性优先级。

图2决策树

点击右侧的“验证”按钮，按照训练样本70%，检测样本30%的分配数据。

图3数据分配

为了方便结果的观察，点击右侧“保存”，勾选已保存的变量：终端节点数、预测值、预测概率、样本分配。

图4设置已保存变量

考虑到防止节点个案数太少而导致结果不准确，因此通过“条件”按钮，将最小个案树父节点设置为400、子节点设置为200。

图5增长限制

三、结果分析

通过以上SPSS操作步骤，我们可以得到决策树分析的结果。

1、模型摘要

主要包括生长法、自变量、结果。在本案例中，经过筛选，最终将纳入的是fico_score指标，这意味着这个变量起到重要作用，实际业务操作过程中，我们应该重点关注这个指标。

图6模型摘要

2、风险

查看模型效果的重要依据之一，从风险表格中可以看到，训练估算0.061，表示在70%的训练样本中有6.1%的样本被错误归类。检验估算0.069，表示在30%的测试样本中有6.9%的样本被错误归类。

图7风险

3、分类

查看模型效果的重要依据之一，从风险表格中可以看到，训练集93.9%，表示该模型正确率为93.9%。检验集表示在用训练集训练好的模型去检验测试集的数据，正确率为93.1%。

图8分类

四、小结

以上是利用SPSS决策树模型对信用风险识别数据进行分析，首先我们从Kaggle的项目获取数据，然后通过SPSS决策树模型对数据进行分析，最后对得到的分析结果进行解析，可以看到整个分析结果还是非常不错，正确率非常高，也同时说明该模型具有一定的可用性。

方便获取更多学习、工作、生活信息请关注本站微信公众号 城东书院微信服务号

来顶一下

返回首页

上一篇:论文写作中如何使用SPSSS进行相关性分析下一篇:利用SPSS做一致性分析

高考生入学注意：这些大	【健康】纯净水、天然
14种竞赛生升学路径盘	excel后缀xls和xlsx有

首页

学习

工作

生活

兴趣组

电子

计算机

掌上机件

图库

游戏

考试与竞赛

黑板报

国学

外语

下载

故事汇

社区

课程

SPSS决策树分析使用教程