当数据之间存在量纲不一致,数据波动大时,就需要对数据进行标准化处理,数据标准化处理公式较为简单,但数据量比较大时,就需要借助数据统计软件,例如IBM SPSS Statistics,SPSS怎么进行数据标准化处理,SPSS数据标准化处理步骤是怎样的,本文将结合实例,向大家做简单的说明。
一、SPSS怎么进行数据标准化处理
常用的数据标准化处理方法为Z-Score方法,Z-Score方法计算公式如下:
其中为数据标准化处理后的值,X为数据中待标准化的值,为这组数据的平均值,为这组数据的标准差。
SPSS的数据标准化处理采用的也是Z-Score方法,输入数据如图1所示,按第二小节介绍的步骤进行标准化处理,SPSS将按照上述公式进行计算,并输出标准化数据。
二、SPSS数据标准化处理步骤
SPSS进行数据标准化处理非常简便,首先点击分析,描述统计,描述,如图2所示。
将数据加入变量,然后勾选将标准化值另存为变量。然后点击确定。
输出的变量如图所示,我们将在第三小节中对标准化后的数据特点进行介绍。
三、SPSS标准化数据特性
本文所举的实例中,VAR00001是由软件生成的200到500随机数,VAR00002是VAR00001加10000而得到的,这两组数据数量级不同,平均值不同,但标准偏差相同,即分布相同。如果这两组数据不经标准化处理,VAR00002在统计过程中会占据更大的优势,经数据标准化处理后,两组数据完全相同,统计学意义上无差别,大家可以仔细比较图4中两组数据。
另外一点向大家介绍的是标准化数据的分布,对于正态分布的数据,经Z-Score处理后,根据正态分布量表,Z小于2时,事件概率为1-0.02275=0.97725,因此绝大多数数据将位于(-2,2)之间,极少数据或称谓离群数据会分布于(-3,-2)和(2,3)之间。
观察图4中所示的数据也可以看出,全部数据均位于(-2,2)之间,如果尽可能多的生成随机数,总会有数据脱离此范围,小概率事件尽管概率低,但无限次的实验,总会发生,这就是小概率事件不可忽视的原因。
SPSS怎么进行数据标准化处理,SPSS内部会对数据按Z-Score方法进行处理,然后对标准化数据进行输出,SPSS数据标准化处理步骤也非常简单,在描述统计中即可进行。