文档章节

单因素方差分析

不愿透露性别的某名宿
 不愿透露性别的某名宿
发布于 2017/07/26 00:03
字数 1069
阅读 38
收藏 0
  • 单因素方差分析
当方差分析中只涉及一个分类型自变量时称为单因素方差分析

  • 数据结构
1、A表示因素(或因子)
2、k表示因素下的水平数,比如A因素中有k个水平:A1,A2,...Ak
3、观察值用Xij表示第i个水平(总体)的第j个观测值,如X43,表示第4个水平下下的第3个观测值

  • 分析步骤

  • 提出假设
H0 : μ1 = μ2 =...=μ..= μk               自变量对因变量没有显著影响
H1 : μi(i=1,2,...k)不全相等       自变量对因变量有显著影响

    说明
1、如果拒绝H0,意味这自变量对因变量有显著的影响,
2、拒绝H0,只是表明至少有两个总体均值不想等,并不意味这所有的都不相等
3、如果接受H0,意味着没有充分证据证明自变量对因变量有显著的影响,(换句话说,没法证明自变量对因变量有显著影响;自变量对因变量没有显著影响)

  • 构造并计算统计量
1、计算各样本的均值

ni表示:i水平(总体)的样本量,Xij表示为第i个总体的第j个观测值

2、计算全部观测值的总体均值
全部观测值的总和除以观测值的总个数的结果
 n=n1+n2...nk,全部的观测值总量

3、计算各误差的平方和
    a、总平方和
全部观测值与总体均值 的误差平方和,反映 全部观测值的离散状况

    b、组间平方和
各组均值 (i=1,2,..k )与总体均值        的误差平方和,反映样本均值之间的差异程度,又称因素平方和
    c、组内平方和
各水平或者组各样本与其组均值的误差平方和,反映了组内每个样本各观测值的离散状况,同时也反映了随机误差的大小
 
    说明
a、SSA是随机误差和系统误差大小的度量,反映了自变量(行业)对因变量(被投诉次数)的影响,也称为自变量效应或者因子效应
b、SSE是对随机误差大小的度量,也被称为 残差变量,它所引起的误差也称为 残差效应 
c、SST是全部数据总误差程度的度量,它反映了自变量和残差变量的共同影响,因此 它等于自变量效应加残差效应

 4、计算统计量
    各误差平方和的大小与观测值的多少有关,为了消除观测值对误差平方和大小的影响,需要将其平均,也就是用个平方和除以他们所对应的自由度, 这一结果称为均方,也称方差
  
     SST的自由度为 n-1,其中n为全部观测值的个数
    SSA的自由度为k-1,k为水平(总体)数
    SSE的自由度n-k

     只要比较组间均方和组内均方的差异即可,所以计算
    SSA的均方:组件均方或者组间方差  MSA
SSE的均方:组内均方或者组内方差 MSE

将MSA/MSE得到所需要的检验统计量F,当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为n-k的F分布
 
  • 统计决策
根据给定的显著水平a,在F分布表中查找与分子自由度df1 = k -1、分母自由度df2 = n-k相应的临界值Fa(k-1,n-k)
    1、F > Fa,则拒绝原假设 H0: μ1=μ2=...=μk,说明 自变量对因变量 有显著影响
    2、F < Fa,则接受原假设 H0,说明没有证据表明有显著影响
也可以用 P 值做决策
当 P < a (显著水平如0.05),则拒绝H0,相反则接受 H0


注:
当检验的因素只有两个水平时,单因素方差分析与两个样本均值之差的t检验的结果完全相同,因为当因素的水平k=2时,检验的t统计量与F统计量关系为:F = t^2

 










© 著作权归作者所有

上一篇: 关系强度的测量
下一篇: 方差分析引论
不愿透露性别的某名宿
粉丝 0
博文 310
码字总数 183957
作品 0
深圳
其他
私信 提问
【数据分析师必备】九大常用数据分析方法汇总(上)

一、描述性统计 定义:描述性统计是一类统计方法的汇总,揭示了调查总体的数据分布特性。描述性统计分析要对调查总体所有变量的有关数据进行统计性描述,主要包括数据的频数分析、集中趋势分...

奋斗小窝
05/08
0
0
R语言一键批量完成差异统计和可视化

撰文:文涛 南京农大 责编:刘永鑫 中科院遗传发育所 R语言一键完成差异检测从数据到展示 单因素差异分析的完整方案 关键词:正态性检验;方差齐性;非参数检验;秩和检验;多重比较;带显著...

宏基因组
06/13
0
0
统计学基础知识(导航页)

1 数据分析基础:统计学科知识框架 2 数据的收集、整理与保存 3 统计资料的总量描述及常用经济指标介绍 4 数据集中趋势描述 5 数据离散程度描述 6 总体标准差的估计方法及精度 7 数据分布形状...

d07qs2kxkh0kksxex
2017/11/11
0
0
数据分析实战--保险公司客户分类分析

小文 | 公众号: 小文的数据之旅 五一假期过去了,不知道大家过得怎么样呢?假期的这几天,小文没有选择出去旅游(不想成为人海中的一员-。-),而是待在家里好好地阅读了我的新书--陈哲老师的《...

小文的数据之旅
07/25
0
0
t检验和方差分析的前提条件及应用误区

选摘自《医学统计应用错误的诊断与释疑》,军事医学科学出版社,主编:胡良平   用于比较均值的t检验可以分成三类,第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三...

Betty__
2016/10/03
52
0

没有更多内容

加载失败,请刷新页面

加载更多

64.监控平台介绍 安装zabbix 忘记admin密码

19.1 Linux监控平台介绍 19.2 zabbix监控介绍 19.3/19.4/19.6 安装zabbix 19.5 忘记Admin密码如何做 19.1 Linux监控平台介绍: 常见开源监控软件 ~1.cacti、nagios、zabbix、smokeping、ope...

oschina130111
今天
13
0
当餐饮遇上大数据,嗯真香!

之前去开了一场会,主题是「餐饮领袖新零售峰会」。认真听完了餐饮前辈和新秀们的分享,觉得获益匪浅,把脑子里的核心纪要整理了一下,今天和大家做一个简单的分享,欢迎感兴趣的小伙伴一起交...

数澜科技
今天
7
0
DNS-over-HTTPS 的下一代是 DNS ON BLOCKCHAIN

本文作者:PETER LAI ,是 Diode 的区块链工程师。在进入软件开发领域之前,他主要是在做工商管理相关工作。Peter Lai 也是一位活跃的开源贡献者。目前,他正在与 Diode 团队一起开发基于区块...

红薯
今天
12
0
CC攻击带来的危害我们该如何防御?

随着网络的发展带给我们很多的便利,但是同时也带给我们一些网站安全问题,网络攻击就是常见的网站安全问题。其中作为站长最常见的就是CC攻击,CC攻击是网络攻击方式的一种,是一种比较常见的...

云漫网络Ruan
今天
12
0
实验分析性专业硕士提纲撰写要点

为什么您需要研究论文的提纲? 首先当您进行研究时,您需要聚集许多信息和想法,研究论文提纲可以较好地组织你的想法, 了解您研究资料的流畅度和程度。确保你写作时不会错过任何重要资料以此...

论文辅导员
今天
8
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部