什么是无序多分类?举一个例子,当我们要研究基因突变与疾病之间的关系时,因变量就是疾病的各种分类,如乳癌、胃癌、鳞癌等多种,此时因变量不是简单的患病和不患病,且他们之间是无序的,这就是无序多分类。
当我们要研究自变量与无序多分类因变量之间的关系时,就需要使用到SPSS软件带有的多元逻辑回归模型,下面我来讲解下如何使用。
一、操作演示
如图1所示,我们在IBM SPSS Statistics中建立一组数据,其中有三个变量:ID代表患者编号,第二栏的疾病类型代表因变量,第三栏的是否基因突变代表自变量。
点击【分析】--【回归】--【多元Logistic】,如图2,打开多元逻辑回归界面。
首先我们将疾病类型选入因变量的位置,是否基因突变选入因子的位置,如果自变量中还有其他的连续型变量,则需要放入协变量位置,具体见图3。
由于我们的因变量疾病类型是多分类变量,而多元逻辑回归的原理是先指定一个类别为参考类别,然后将其他类别分别与参考类别对比。
因此我们需要点击“参考类别”按钮,然后决定我们要作为参考类别的值,比如我们将0作为参考类别,则选择“第一个类别”或者选择“定制”类别,然后输入值为0。
二、结果分析
设定后,我们点击“继续”和“确定”保存设置,等待SPSS生成多元逻辑回归的计算结果。
其中,模型拟合信息表格给出了模型拟合好坏的信息。当中-2对数似然的值越小越好,从结果中可以看出,加入自变量后的模型比只有常数项的模型拟合要好(27.311<80.234),显著性结果小于0.001,说明自变量是否基因突变的加入是有统计学意义的。
另外,参数估计值表格,以腺癌组为例,X=0相比于X=1,系数值Exp(B)为0.068,说明基因X未突变者患腺癌的风险是突变者患腺癌风险的1/0.068即14.71倍。另外,显著性<0.001,说明腺癌这个系统是具有统计学意义的。
最后通过上述的分析,我们可以得出结论:基因X突变患者相比于未突变患者,其发生某恶性肿瘤类型为腺癌、鳞癌和大细胞癌的风险分别为14.71、3.66和8.93倍,这说明基因突变与各类型都具有一定的关系。这就是本节关于IBM SPSS Statistic进行多分类逻辑回归的相关教程了,更多教程尽在城东书院网站上。