您当前的位置:首页 > 计算机 > 软件应用 > 采集运算

如何使用IBM SPSS Statistics的贝叶斯进行数据分析

时间:08-17来源:作者:点击数:

SPSS的贝叶斯分析是基于一种分类模型,适用于在分类确定的条件下,根据某一研究对象的各种特征值进行统计学分析。使用该模型分析前提包括数据有序分类、符合线性假设、变量间独立等条件。下面将使用SPSS的贝叶斯模型对鸢尾花(iris)数据集进行数据分析,让你对贝叶斯分析的使用更加了解。

一、 数据准备与处理

本例使用的是“鸢尾花(iris)数据集”(机器学习经典数据集),通过SPSS软件打开预先下载的数据,总共有150条数据,包括no(编号)、spno(类别)、slen(花萼长度)、swid(花萼宽度)、plen(花瓣长度)、pwid(花瓣宽度)等六个变量,我们将使用上述变量对数据个案进行贝叶斯分析。

图1数据展示
图1数据展示

由于整个数据可能存在不完整或者不干净的数据,因此需要对数据进行预处理。在SPSS中顶部菜单栏点击“分析”—“描述统计”—“描述”,打开描述窗口之后,将slen、swid、plen、pwid四个鸢尾花特征值加载到变量中。并且点击右侧选项按钮,勾选离散部分的“方差”选项。

图2加载变量
图2加载变量

根据描述性统计,可以看到没有分布特别的离散点,不存在缺少值和不合理分布,说明该数据能够用来做分析。

图3描述统计
图3描述统计

二、贝叶斯数据分析

贝叶斯分析属于分类算法进行分析。点击顶部菜单栏“分析”-“分类”-“判别分析”,即可打开贝叶斯分析窗口,将spno(分类)加载到分组变量,将slen、swid、plen、pwid四个特征值加载到自变量选框,并且点击定义范围值设置为0-2。

图4 判别分析
图4判别分析

点击右侧统计按钮,勾选描述选框的“单变量”、“博克斯”和函数系统选框的“费希尔”、“未标准化”。

单变量:对各类中同一自变量均值都相等的假设进行检验,输出单变量的方差分析结果。

博克斯:对各组的协方差矩阵相等的假设进行检验。

图5统计设置
图5统计设置

点击右侧分类按钮,勾选显示选框的“摘要表”、“留一分类”和图选框的“合并组”、“分组”、“领域图”,并且勾选将缺失值替换为均值。

合并组:生成一张包括各类的散点图。

分组:根据前两个判别函数值对每一类生成一张激点图,共分为几类就生成几张散点图。

领域图:生成用于根据函数值把观测量分到各组中去的边界图。

图6分类设置
图6分类设置

三、结果分析

由于分析项目比较多,因此这里就不逐一进行结果分析,这里主要是讲解SPSS的贝叶斯分析图和交叉表分析。通过典则判别函数图可以看到将数据分为三类,并且每一类型均确定数据重心,根据重心距离即可确定分类。

图7贝叶斯分析图
图7贝叶斯分析图

通过交叉表项目,输出对每个观测量进行分类的结果分析,可以看到结果正确率达到98%,可说明该分析效果还是非常不错。

图8交叉表分析
图8交叉表分析

四、小结

以上是利用SPSS的贝叶斯模型对鸢尾花数据集进行分析,首先是获取和预处理数据,然后通过贝叶斯模型对数据进行分析,最后对得到的分析结果进行解析,可以看到整个分析结果还是非常不错,正确率非常高,也同时说明SPSS的贝叶斯模型具有较强的实用性。

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门