文档章节

方差分析引论

不愿透露性别的某名宿
 不愿透露性别的某名宿
发布于 2017/07/26 00:03
字数 915
阅读 4
收藏 0
  • 方差分析
1、通过检验各总体的均值是否相等来判断 分类型自变量对数值型因变量是否有显著影响
2、判断总体的均值相等,可期望样本均值也会很接近,如果样本的均值越接近,推断总体的均值相等的证据越充分

 

 
  • 相关概念
a、因素、因子
    所检验的对象,例如上述行业

b、水平、处理
    每个因素的不同表现了,如行业下面分为零售业、旅游业、航空公司、家电制造业

c、观测值
    每个因子水平下得到的样本数据,如上述的被投诉的数值

d、总体
    因素的每一个水平可以看做总体,比如零售业、旅游业、航空公司、家电制造业可以为4个总体

  • 方差分析的基本思路及原理

  • 误差分解
数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响

a、组内误差
    来自水平内部的误差,如零售业中所抽取的几家企业被投诉次数之间的误差,反映样本内部的离散程度

b、组间误差
    来自不同水平之间的误差,差异可能是由抽样本身的随机误差,也可能由行业本身的系统性因素造成的系统误差,反映不同样本之间的离散程度
    组间误差=随机误差+系统误差

c、SST
    1、反映全部数据误差大小的平方和称为总平方和,记作SST
    2、反映全部观测值的离散状况

d、SSE
    1、反映组内误差大小的平方和称为组内平方和,也称为误差平方和或者残差平方和
    2、反映组内样本的离散程度

e、SSA
    1、反映组间误差大小的平方和称为组间平方和,也称为因素平方和
    2、反映样本均值之间的差异程度

  • 误差分析

a、如果不同行业对被投诉次数没有影响,那么组间误差只有随机误差,没有系统误差
    所以组间误差与组内误差经过平均后的数值(均方或方差)就应该很接近,比值接近1,反之不同行业对投诉次数有影响,组件误差中除了随机误差,还会包含系统误差,这是组间误差平均后的数值就会大于组内误差平均后的数值,他们之间的壁纸就会大于1,当比值达到某个程度,就表示存显著影响

b、根据上面的分析,检验被投诉次数的差异主要是什么原因引起的,如果差异是系统误差,就认为不同行业对被投诉次数有显著影响

  • 方差分析中的基本假定

a、每个总体都服从正态分布,对于因素的每个水平,其观测值的是来自正态分布总体的简单随机样本

b、各个总体的方差        必须相同

c、观察值是独立的

  • 问题的一般提法
设因素有k个水平,每个水平的均值分布用μ1,μ2...μk表示,要检验k个水平(总体)的均值是否相等,需提出如下假设
H0:μ1 = μ2 =... =μk             自变量对因变量没有显著影响
H1:μ1,μ2... μk不全相等     自变量对因变量有显著影响





© 著作权归作者所有

不愿透露性别的某名宿
粉丝 0
博文 310
码字总数 183957
作品 0
深圳
其他
私信 提问
学习周记6:2019.3.25-2019.3.31

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/BeerBread134/article/details/88785051 前言 这学期几乎全是硬核的算法/程序课,为了督促自己认真学习,我将...

陶晨毅
03/25
0
0
学习周记4:2019.3.11-2019.3.17(模板)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/BeerBread134/article/details/88113035 前言 这学期几乎全是硬核的算法/程序课,为了督促自己认真学习,我将...

陶晨毅
03/04
0
0
学习周记3:2019.3.4-2019.3.10(模板)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/BeerBread134/article/details/87908291 前言 这学期几乎全是硬核的算法/程序课,为了督促自己认真学习,我将...

陶晨毅
02/24
0
0
弗洛伊德经典作品集.epub+mobi+azw3

简介: 《性学三论与爱情心理学》 《精神分析引论》 《自我本我与集体心理学》 《梦的解析-插图版》 《性学三论与爱情心理学》是阐释弗洛伊德在人性与人类行为动机方面主要研究理论的扛鼎之作...

jackmk
2018/05/30
0
0
学习周记4:2019.3.11-2019.3.17

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/BeerBread134/article/details/88557080 前言 这学期几乎全是硬核的算法/程序课,为了督促自己认真学习,我将...

陶晨毅
03/14
0
0

没有更多内容

加载失败,请刷新页面

加载更多

OSChina 周一乱弹 —— 年迈渔夫遭黑帮袭抢

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @tom_tdhzz :#今日歌曲推荐# 分享Elvis Presley的单曲《White Christmas》: 《White Christmas》- Elvis Presley 手机党少年们想听歌,请使劲...

小小编辑
今天
1K
16
CentOS7.6中安装使用fcitx框架

内容目录 一、为什么要使用fcitx?二、安装fcitx框架三、安装搜狗输入法 一、为什么要使用fcitx? Gnome3桌面自带的输入法框架为ibus,而在使用ibus时会时不时出现卡顿无法输入的现象。 搜狗和...

技术训练营
昨天
5
0
《Designing.Data-Intensive.Applications》笔记 四

第九章 一致性与共识 分布式系统最重要的的抽象之一是共识(consensus):让所有的节点对某件事达成一致。 最终一致性(eventual consistency)只提供较弱的保证,需要探索更高的一致性保证(stro...

丰田破产标志
昨天
8
0
docker 使用mysql

1, 进入容器 比如 myslq1 里面进行操作 docker exec -it mysql1 /bin/bash 2. 退出 容器 交互: exit 3. mysql 启动在容器里面,并且 可以本地连接mysql docker run --name mysql1 --env MY...

之渊
昨天
12
0
python数据结构

1、字符串及其方法(案例来自Python-100-Days) def main(): str1 = 'hello, world!' # 通过len函数计算字符串的长度 print(len(str1)) # 13 # 获得字符串首字母大写的...

huijue
昨天
6
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部