文档章节

方差分析引论

不愿透露性别的某名宿
 不愿透露性别的某名宿
发布于 2017/07/26 00:03
字数 915
阅读 4
收藏 0
  • 方差分析
1、通过检验各总体的均值是否相等来判断 分类型自变量对数值型因变量是否有显著影响
2、判断总体的均值相等,可期望样本均值也会很接近,如果样本的均值越接近,推断总体的均值相等的证据越充分

 

 
  • 相关概念
a、因素、因子
    所检验的对象,例如上述行业

b、水平、处理
    每个因素的不同表现了,如行业下面分为零售业、旅游业、航空公司、家电制造业

c、观测值
    每个因子水平下得到的样本数据,如上述的被投诉的数值

d、总体
    因素的每一个水平可以看做总体,比如零售业、旅游业、航空公司、家电制造业可以为4个总体

  • 方差分析的基本思路及原理

  • 误差分解
数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响

a、组内误差
    来自水平内部的误差,如零售业中所抽取的几家企业被投诉次数之间的误差,反映样本内部的离散程度

b、组间误差
    来自不同水平之间的误差,差异可能是由抽样本身的随机误差,也可能由行业本身的系统性因素造成的系统误差,反映不同样本之间的离散程度
    组间误差=随机误差+系统误差

c、SST
    1、反映全部数据误差大小的平方和称为总平方和,记作SST
    2、反映全部观测值的离散状况

d、SSE
    1、反映组内误差大小的平方和称为组内平方和,也称为误差平方和或者残差平方和
    2、反映组内样本的离散程度

e、SSA
    1、反映组间误差大小的平方和称为组间平方和,也称为因素平方和
    2、反映样本均值之间的差异程度

  • 误差分析

a、如果不同行业对被投诉次数没有影响,那么组间误差只有随机误差,没有系统误差
    所以组间误差与组内误差经过平均后的数值(均方或方差)就应该很接近,比值接近1,反之不同行业对投诉次数有影响,组件误差中除了随机误差,还会包含系统误差,这是组间误差平均后的数值就会大于组内误差平均后的数值,他们之间的壁纸就会大于1,当比值达到某个程度,就表示存显著影响

b、根据上面的分析,检验被投诉次数的差异主要是什么原因引起的,如果差异是系统误差,就认为不同行业对被投诉次数有显著影响

  • 方差分析中的基本假定

a、每个总体都服从正态分布,对于因素的每个水平,其观测值的是来自正态分布总体的简单随机样本

b、各个总体的方差        必须相同

c、观察值是独立的

  • 问题的一般提法
设因素有k个水平,每个水平的均值分布用μ1,μ2...μk表示,要检验k个水平(总体)的均值是否相等,需提出如下假设
H0:μ1 = μ2 =... =μk             自变量对因变量没有显著影响
H1:μ1,μ2... μk不全相等     自变量对因变量有显著影响





© 著作权归作者所有

共有 人打赏支持
不愿透露性别的某名宿
粉丝 0
博文 310
码字总数 183957
作品 0
深圳
其他
私信 提问
弗洛伊德经典作品集.epub+mobi+azw3

简介: 《性学三论与爱情心理学》 《精神分析引论》 《自我本我与集体心理学》 《梦的解析-插图版》 《性学三论与爱情心理学》是阐释弗洛伊德在人性与人类行为动机方面主要研究理论的扛鼎之作...

jackmk
05/30
0
0
机器学习之主成分分析PCA及代码示例

一、主成分分析(PCA) 主成分分析(Principal Component Analysis)是一种常用的降维算法,可通过线性组合的方法将多个特征综合为少数特征,且综合后的特征相互独立,又可以表示原始特征的大...

cxmscb
2017/03/26
0
0
确定权重方法之一:主成分分析

确定权重方法之一:主成分分析 什么是权重呢?所谓权重,是指某指标在整体评价中的相对重要程度。权重越大则该指标的重要性越高,对整体的影响就越高。 权重要满足两个条件:每个指标的权重在...

初雪之音
2016/03/24
201
0
【机器学习】主成分(PCA)算法分析

AI 机器学习 - 主成分分析(Principal Compoent Analysis, PCA)。 今天趁下班后看了一会主成分分析算法介绍,其实之前有参加TK同事Machine Learning的系列分享,正好今天看到,现学现卖。 ...

l70ashc3q50
2017/12/18
0
0
机器学习中的归一化方法(Deep learning Normalization Method)

机器学习、数据挖掘工作中,数据前期准备、数据预处理过程、特征提取等几个步骤几乎要花费数据工程师一半的工作时间。同时,数据预处理的效果也直接影响了后续模型能否有效的工作。然而,目前...

weixin_38208741
04/18
0
0

没有更多内容

加载失败,请刷新页面

加载更多

node.js学习笔记之koa框架和简单爬虫练习

Koa -- 基于 Node.js 平台的下一代 web 开发框架 koa是由 Express 原班人马打造的,致力于成为一个更小、更富有表现力、更健壮的 Web 框架。 使用 koa 编写 web 应用,可以免除重复繁琐的回调...

前端小攻略
4分钟前
0
0
JavaScript中的继承及实现代码

JS虽然不像是JAVA那种强类型的语言,但也有着与JAVA类型的继承属性,那么JS中的继承是如何实现的呢? 一、构造函数继承 在构造函数中,同样属于两个新创建的函数,也是不相等的 function Fn...

peakedness丶
26分钟前
1
0
记一次面试最常见的10个Redis"刁难"问题

导读:在程序员面试过程中Redis相关的知识是常被问到的话题。作为一名在互联网技术行业打击过成百上千名的资深技术面试官,本文作者总结了面试过程中经常问到的问题。十分值得一读。 Redis在...

小刀爱编程
39分钟前
14
0
TiDB Lab 诞生记 | TiDB Hackathon 优秀项目分享

本文由红凤凰粉凤凰粉红凤凰队的成员主笔,他们的项目 TiDB Lab 在本届 TiDB Hackathon 2018 中获得了二等奖。TiDB Lab 为 TiDB 培训体系增加了一个可以动态观测 TiDB / TiKV / PD 细节的动画...

TiDB
52分钟前
4
0
当区块链遇到零知识证明

本文由云+社区发表 当区块链遇到零知识证明 什么是零知识证明 零知识证明的官方定义是能够在不向验证者任何有用的信息的情况下,使验证者相信某个论断是正确的。这个定义有点抽象,下面笔者举...

腾讯云加社区
今天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部