IBM SPSS Statistics的直方图与条形图在数据呈现上很相似,都是运用条状图形展示数据。但除了外形相似外,实际上,直方图与条形图无论是在数据类型、计算方法,还是在变量数量上都有一定的区别。
接下来,我们将通过一些例子来对比学习这两种图表形式。在本例中,将会使用到的是SPSS旧对话框中的条形图与直方图。
一、数据准备
本例使用到的是一组包含定性与定量变量的销售数据,包含了客流量、销售额、销售量三个定量变量,以及店铺类型、星级两个定性变量。
二、应用的变量类型不同
为什么数据要同时包含定性与定量两种变量?这是因为条形图与直方图的最大不同点在于适用的变量类型不同。
先来看一下直方图的变量设置面板,其中仅包含了一个变量,说明直方图适用于单变量的数据展示。另外,直方图可同时展示正态曲线。
我们将销售额设为直方图的变量。
如图4所示,直方图展示了销售额的分布,同时,通过正态曲线可检验数据是否符合正态分布。
需要注意的是,直方图对数值进行了分段,展示的是分段数值所占的频率。
当我们将店铺类型添加到直方图的变量时,SPSS会弹出警告,说明直方图变量不能添加字符串变量,因无法实现数值的分段。
与直方图相反,条形图则适用于定性数据,展示的是类别变量的计数值。
我们将店铺类型设为类别轴。
如图7所示,从店铺类型条形图可观察到不同店铺的计数,加盟店比直营店多一些。
条形图虽没有严格限制应用的数据类型,但如果将定量数据设为类别轴的话,条形图会显得很臃肿,并且也没什么展示意义。这是因为条形图无分段功能,无法对数值进行分段计数。
三、可同时展示的变量数量不同
在可同时展示的变量数量上,条形图有很大的优势,可同时展示两个变量作簇状条形图与堆积条形图。
簇状条形图可设定类别轴变量与聚类定义依据变量,来同时对比两个变量的数据分布。
我们将店铺类型设为类别轴、星级设为聚类定义依据。
根据以上变量设置,可得到如图11所示的簇状条形图,可同时对比加盟店与直营店中不同星级店铺的数量。比如,可以观察到,加盟店的四星店铺比直营店的四星店铺多。
堆积条形图则可以设置类别轴与堆积定义依据来观察A变量中B变量的占比。
我们将店铺类型设为类别轴、星级设为堆积定义依据。
根据以上设置,可得到加盟店与直营店的星级店铺占比。
四、小结
综上所述,虽然SPSS的直方图与条形图都是条状图,但两种图表应用的变量类型、变量数量都有所不同。
直方图适用于定量数据,并可展示数据的分段频率;而条形图适用于定性数据,可通过簇状条形图与堆积条形图展示两个变量的数据。