您当前的位置:首页 > 计算机 > 软件应用 > 采集运算

R语言方差分析p值怎么计算 R语言方差分析例题

时间:08-17来源:作者:点击数:

作为统计软件的一员,方差分析在R语言里也是必不可少的一门课程,在方差分析的结果里,p值更是重中之重,本文就结合例题来介绍一下R语言中方差分析的p值怎么计算,R语言方差分析例题。因为一一介绍各种情况的篇幅过长,这里就以两样本均值的假设检验为例来说明。

一、r语言方差分析p值怎么计算

设两样本分别为X和Y,基于中心极限定理,无论X和Y属于什么分布,只要样本量足够大,它们的均值服从正态分布。由于两者是独立样本,故而它们均值也服从正态分布。

1、大样本情况下

设样本X为x1、x2、⋯、xn,样本Y为y1、y2、⋯、ym,它们的均值分布为:X、Y,方差为S2x/n、S3y/m

那么对应的统计量为:

图1:大样本的统计量
图1:大样本的统计量

p值是说在原假设成立的条件下,原假设发生的概率,若是p值小于0.05,发生概率小于0.05时,认为是小概率发生了,即是差异性显著,拒绝原假设。

公式:

双边假设的p值:

图2:双边假设的p值
图2:双边假设的p值

将系列代码输入R语言:

图3:大样本的p值
图3:大样本的p值

结果:得到[1] 1.608277e-05

2、小样本情况下:

输入系列代码:

图4:小样本的p值
图4:小样本的p值

得到结果:[1] 4.280554e-13

二、R语言的方差分析例题

接下来就来实战演练一下R语言如何进行方差分析的。

1.导入数据

这里就直接调用R语言自带的一个数据库——分析不同的花的亚种,其花瓣的特征如长度,是否存在差异。

图5:引用数据
图5:引用数据

其中Species将鸢尾花分为三种,其它4个指标分别表示鸢尾花的花的特征。比如Sepal.Length表示花瓣的长度。这里Species成为分组变量,也就是所谓的“因素”(相当于回归分析中的x);花瓣的长度为结果变量(相当于回归分析中的y),是比较组间均值差异的变量指标。

2.键入R语言方差分析的因子(自变量和因变量)

图6:引入因子
图6:引入因子

3.键入avol函数命令

图7:键入avol命令
图7:键入avol命令

按回车,就可以得到初步结果

图8:avol分析初步结果
图8:avol分析初步结果

4.键入summary()函数提取方差分析结果

图9:summary函数
图9:summary函数

结果解释:p值远小于0.001,说明鸢尾花的品种这个因素,对鸢尾花花瓣的长度,有显著的影响;或通俗点说,不同种类的鸢尾花的花瓣长度(均值)显著不同(至少有两种显著不同)

三、方差分析在各大统计软件中孰优孰劣

Stata还是最简单高效。就两个命令,一个叫oneway,一个叫anova。oneway用于做单因素方差分析,anova则用于做多因素方差分析。

Excel、SPSS中也很方便,都有对应的选项可以直接分析。SPSS更胜于excel,excel一般用于呈现数据,而spss则是统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品,功能更强大,将spss用于方差分析更加简易。

在R语言和python中就要涉及到一些计算机语言了,没有形象具体的对话框和选项,相对来说啰嗦一些。不过更加严谨。

四、总结

这就是这次带来的R语言方差分析p值怎么计算,R语言方差分析例题,希望对大家有所帮助。

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门