方差分析引论
方差分析引论
不愿透露性别的某名宿 发表于6个月前
方差分析引论
  • 发表于 6个月前
  • 阅读 2
  • 收藏 0
  • 点赞 0
  • 评论 0

标题:腾讯云 新注册用户域名抢购1元起>>>   

  • 方差分析
1、通过检验各总体的均值是否相等来判断 分类型自变量对数值型因变量是否有显著影响
2、判断总体的均值相等,可期望样本均值也会很接近,如果样本的均值越接近,推断总体的均值相等的证据越充分

 

 
  • 相关概念
a、因素、因子
    所检验的对象,例如上述行业

b、水平、处理
    每个因素的不同表现了,如行业下面分为零售业、旅游业、航空公司、家电制造业

c、观测值
    每个因子水平下得到的样本数据,如上述的被投诉的数值

d、总体
    因素的每一个水平可以看做总体,比如零售业、旅游业、航空公司、家电制造业可以为4个总体

  • 方差分析的基本思路及原理

  • 误差分解
数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响

a、组内误差
    来自水平内部的误差,如零售业中所抽取的几家企业被投诉次数之间的误差,反映样本内部的离散程度

b、组间误差
    来自不同水平之间的误差,差异可能是由抽样本身的随机误差,也可能由行业本身的系统性因素造成的系统误差,反映不同样本之间的离散程度
    组间误差=随机误差+系统误差

c、SST
    1、反映全部数据误差大小的平方和称为总平方和,记作SST
    2、反映全部观测值的离散状况

d、SSE
    1、反映组内误差大小的平方和称为组内平方和,也称为误差平方和或者残差平方和
    2、反映组内样本的离散程度

e、SSA
    1、反映组间误差大小的平方和称为组间平方和,也称为因素平方和
    2、反映样本均值之间的差异程度

  • 误差分析

a、如果不同行业对被投诉次数没有影响,那么组间误差只有随机误差,没有系统误差
    所以组间误差与组内误差经过平均后的数值(均方或方差)就应该很接近,比值接近1,反之不同行业对投诉次数有影响,组件误差中除了随机误差,还会包含系统误差,这是组间误差平均后的数值就会大于组内误差平均后的数值,他们之间的壁纸就会大于1,当比值达到某个程度,就表示存显著影响

b、根据上面的分析,检验被投诉次数的差异主要是什么原因引起的,如果差异是系统误差,就认为不同行业对被投诉次数有显著影响

  • 方差分析中的基本假定

a、每个总体都服从正态分布,对于因素的每个水平,其观测值的是来自正态分布总体的简单随机样本

b、各个总体的方差        必须相同

c、观察值是独立的

  • 问题的一般提法
设因素有k个水平,每个水平的均值分布用μ1,μ2...μk表示,要检验k个水平(总体)的均值是否相等,需提出如下假设
H0:μ1 = μ2 =... =μk             自变量对因变量没有显著影响
H1:μ1,μ2... μk不全相等     自变量对因变量有显著影响





共有 人打赏支持
粉丝 0
博文 294
码字总数 171538
×
不愿透露性别的某名宿
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: