SPSS重新编码之自动编码功能

时间：02-01来源：作者：点击数：

在进行数据录入时，以数值型数据录入会更有利于后续的统计计算。但如果在录入时，采用了字符串值的录入方式，该如何将其转化为可计算的数值呢？在这种情况下，可以使用IBM SPSS Statistics的重新编码功能，将字符串重新编码为数值。

IBM SPSS Statistics自动重新编码功能，可自动为变量创建编码，同时保留变量定义的标签和值标签，对未定义值标签的任何值，将使用原值作为重新编码后的值标签。

一、打开数据文件

首先，打开一组数据，该数据包含了性别、客单价、地区等变量。我们需要对地区与来源进行重新编码，方便后期的数据处理。

图1：示例数据

二、使用自动编码功能

如图2所示，打开IBM SPSS Statistics转换菜单中的“自动重新编码”功能。

图2：自动编码功能

如图3所示，设置面板中包含变量新名称、编码起点、编码模板等选项。接下来，我们使用示例的数据逐步操作。

图3：自动编码设置面板

1、选择变量

首先，如图4所示，将需要重新编码的地区变量从左侧添加到右侧方框中。

图4：选择变量

2、编辑新名称

然后，如图5所示，选中已添加的地区变量，在新名词处输入重新编码后的变量名称：地区编码，并将其添加为新名称。

图5：添加新名词

3、设置编码方式

完成变量的设置后，再进一步设置如下选项：

1. 编码起点，设置从最小值或最大值处开始编码

2. 对所有变量使用同一种重新编码方案，即添加的所有重新编码变量都采用同一套编码方案，下文我们会使用实例解释

3. 将空值设为用户缺失值

4. 应用模板或另存为模板（作为码表方便后续使用）

图6：设置编码方式

如果我们添加了两个变量为重新编码的变量，比如地区和来源，同时还勾选了“对所有变量使用同一种重新编码方案”选项的话，就会出现如图7所示的结果，地区与来源的变量会混合起来重新编码。

图7：对所有变量执行同一编码方案

但实际上，我们应该要将两个变量的编码值分开，因此，本例不能勾选“对所有变量使用同一种重新编码方案”选项。

取消选项勾选后，再次运行，如图8所示，可以看到，地区与来源的码表已经分开了。

图8：对所有变量执行不同编码方案

返回数据集，如图9所示，可以看到，数据中出现了两个新的变量，分别是“地区编码”与“来源编码”。

图9：完成重新编码

以上就是IBM SPSS Statistics自动重新编码功能的应用介绍。如果变量中包含较多不同字符串值的话，该功能就能很好地减轻编码的负担，并能自动形成码表供后续使用。

方便获取更多学习、工作、生活信息请关注本站微信公众号 城东书院微信服务号

高考生入学注意：这些大	【健康】纯净水、天然
14种竞赛生升学路径盘	excel后缀xls和xlsx有