SPSS多层感知器神经网络分析是基于模仿人类大脑结构及思维模式的信息处理系统,可通过算法从数据中学习并形成训练模型,再将模型用于分析数据以得到预测结果,因此在进行神经网络分析时会将数据分为训练区与检验区,以便于得到准确预测数据的概率,SPSS神经网络怎么分区,SPSS神经网络如何解读呢?今天一起来看看吧。
一、SPSS神经网络怎么分区
先将现有数据表格导入SPSS中,或者在SPSS安装文件夹下的“Sample”文件夹中有很多自带的数据模板,可以用这些模板数据来体验功能效果。
点击菜单“分析”-“神经网络”-“多层感知器”进入神经网络设置面板。
在变量设置板块中,将想要预测的变量置入因变量,将类型变量加入因子,将其他连续型变量加入协变量。
在“分区”板块可以对神经网络进行分区。
在分区设置有两种分区方式。
1、随机分区
可以根据样本数量自动分配个案,默认是训练数据占70%,检验数据占30%,而且这两者的占比可以手动调整,从样本总量中随机划分训练样本与检验样本。
2、分区变量指定样本分区
通过给样本指定分区变量来进行分配,这样就能有目的性地将一部分样本设置为训练集,另一部分设置为检验集,并进行针对性地神经网络分析。
在完成神经网络设置后开始神经网络分析,SPSS会自动生成输出文档,包括网络图、模型摘要、参数估算值、预测图、自变量重要性图等。
二、SPSS神经网络如何解读
通过上面的数据可以得到一份分析报告,按照报告中数据与表格展现顺序,我们来看看神经网络分析数据的解读方法。
1、个案处理摘要
这里是SPSS对数据的分区与采用摘要数据,共1500条数据,随机分配了1046条作为训练集数据,占比69.7%,剩余数据则作为检验集数据,占比30.3%,没有无效数据,所以“排除”为0。
2、网络信息
这一部分内容分三层,显示了本次分析所设置的输入层影响因子与协变量内容,隐藏层单元数,以及输出层的内容。
3、神经网络图
这一部分可以看到不同变量之间的颜色、图形各不相同,一个变量的线条颜色越深,代表其在计算分析中的权重越高;变量的板块越大,则代表其价值越高。
4、分类
从分类数据中可以看到随机分配的训练集与检验集中样本数据的预测正确率仅有“59.3%”和“58.6%”,说明本次分析效果不是很好,正确率较低。(正确率低不代表神经网络算法不好,而是说明这份样本数据不适合用神经网络算法来进行分析)
5、自变量重要性与正态化重要性
自变量重要性与正态化重要性的结果一致,不过一个以数值与表格形式体现,一个以柱状图形式体现。
这两个报告数据显示,各个变量对是否违约的结果影响力大小排列是:工龄>信用卡负债>负债率>其他负债>教育>年龄>收入>地址。
三、SPSS神经网络设置技巧
在上面进行神经网络分析示例时,介绍了设置变量与分区的方法,接下来讲一讲其他选项的设置技巧。
1、输出设置
建议在输出设置中将能勾选的项目全部勾选上,尤其时“网络结构”中的“描述”、“图”与“突触权重”,以及下面的“自变量重要性分析”,这几个还是比较重要的。
2、保存设置
在保存设置中,可以将图中两个“因变量的预测值或类别”与“因变量的预测拟概率”选项都勾选上。
主要就是设置“变量”、“分区”、“输出”与“保存”四项,其他的选项设置可以根据自己需要再进行修改。
以上便是SPSS神经网络怎么分区,SPSS神经网络如何解读的全部内容了,大家如果想要了解更多数据分析技巧,欢迎关注城东书院网站。