作为统计软件的一员,方差分析在R语言里也是必不可少的一门课程,在方差分析的结果里,p值更是重中之重,本文就结合例题来介绍一下R语言中方差分析的p值怎么计算,R语言方差分析例题。因为一一介绍各种情况的篇幅过长,这里就以两样本均值的假设检验为例来说明。
一、r语言方差分析p值怎么计算
设两样本分别为X和Y,基于中心极限定理,无论X和Y属于什么分布,只要样本量足够大,它们的均值服从正态分布。由于两者是独立样本,故而它们均值也服从正态分布。
1、大样本情况下
设样本X为x1、x2、⋯、xn,样本Y为y1、y2、⋯、ym,它们的均值分布为:X、Y,方差为S2x/n、S3y/m
那么对应的统计量为:
p值是说在原假设成立的条件下,原假设发生的概率,若是p值小于0.05,发生概率小于0.05时,认为是小概率发生了,即是差异性显著,拒绝原假设。
公式:
双边假设的p值:
将系列代码输入R语言:
结果:得到[1] 1.608277e-05
2、小样本情况下:
输入系列代码:
得到结果:[1] 4.280554e-13
二、R语言的方差分析例题
接下来就来实战演练一下R语言如何进行方差分析的。
1.导入数据
这里就直接调用R语言自带的一个数据库——分析不同的花的亚种,其花瓣的特征如长度,是否存在差异。
其中Species将鸢尾花分为三种,其它4个指标分别表示鸢尾花的花的特征。比如Sepal.Length表示花瓣的长度。这里Species成为分组变量,也就是所谓的“因素”(相当于回归分析中的x);花瓣的长度为结果变量(相当于回归分析中的y),是比较组间均值差异的变量指标。
2.键入R语言方差分析的因子(自变量和因变量)
3.键入avol函数命令
按回车,就可以得到初步结果
4.键入summary()函数提取方差分析结果
结果解释:p值远小于0.001,说明鸢尾花的品种这个因素,对鸢尾花花瓣的长度,有显著的影响;或通俗点说,不同种类的鸢尾花的花瓣长度(均值)显著不同(至少有两种显著不同)
三、方差分析在各大统计软件中孰优孰劣
Stata还是最简单高效。就两个命令,一个叫oneway,一个叫anova。oneway用于做单因素方差分析,anova则用于做多因素方差分析。
Excel、SPSS中也很方便,都有对应的选项可以直接分析。SPSS更胜于excel,excel一般用于呈现数据,而spss则是统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品,功能更强大,将spss用于方差分析更加简易。
在R语言和python中就要涉及到一些计算机语言了,没有形象具体的对话框和选项,相对来说啰嗦一些。不过更加严谨。
四、总结
这就是这次带来的R语言方差分析p值怎么计算,R语言方差分析例题,希望对大家有所帮助。