哑变量,是一个人为设定的变量,通常取值为0到N,以职业分类来说,0代表学生,1代表工人,2代表老师等等,哑变量就是通过这种取值方式,以此来反映某个变量的不同属性。
哑变量的设置在各个回归模型中都非常重要与常见,今天我们就一起来学习下,如何在SPSS的逻辑回归模型中,设置哑变量。
一、哑变量参数解析
我们想要研究不同的种族之间对某种疾病的患病率是否有不同的差异,下面我们获取了三个不同的种族人群的身体健康数据,其中0表示其他种族;1代表美国黑人;2代表美国白人;3代表印第安人。
由于种族属于无序多分类变量,因此我们需要将种族转化为哑变量后,才能进行逻辑回归计算,点击【分析】--【回归】--【二元Logistic】。
我们先把逻辑回归的因变量和块填入相对应的内容,然后就可以点击“分类”按钮,为多分类的自变量“种族”设置哑变量。
随后在分类协变量中填入“种族”项,参考类别根据自身数据进行填写,在本演示数据中,由于0表示其他种族,是参照组,因此参考类别我们选择“第一个”,如果参照组是最后一个,则参考类别就需要选择“最后一个”。
除参考类别外,我们还需要设置对比方法,可供选择的方法有7种,分别是“指示符”、“简单”、“差异”、“赫尔默特”、“重复”、“多项式”和“偏差”,它们的详细作用如下:
1、“指示符”和“简单”对比方法:用于将某一分类作为参照,其他各个分类分别与参照分类做对比。
2、“差异”对比方法:某个分类与其前面的分类平均值做比较;“赫尔默特”对比方法则是与其后面的分类平均值做比较,它们都常用于有序分类变量。
3、“重复”对比方法:即该分类变量的各个分类,均与前面相邻的一个分类比较,此时前一分类作为参照。
4、“多项式”对比方法:主要是分类类型不同,它只能用于数值型的分类变量。
5、“偏差”对比方法:除参照外,其余的每个分类都与总体水平做比较。
二、结论说明
由于本文的自变量种族是无序多分类,因此我们采用默认的“指示符”方法,点击确定后生成的逻辑回归结果如下图6。从结果中我们可以看到SPSS成功将种族转化为三个哑变量,分别是种族(1)、种族(2)和种族(3)。
经过上面的学习,我们就初步掌握了一种设置哑变量的方法,当然在SPSS中,还可以通过程序去生成更复杂场景中的哑变量。SPSS的功能绝不止于此,更多高大上的功能教程尽在城东书院网站上。