文档章节

线性回归的检验

bapleliu
 bapleliu
发布于 2017/09/04 23:28
字数 684
阅读 130
收藏 0

钉钉、微博极速扩容黑科技,点击观看阿里云弹性计算年度发布会!>>>

 在一元线性回归和多元线性回归中常常需要进行线性显著性检验(F检验)和系数相关性检验(t检验)。

 通过对数据进行分析得出数据服从下面公式:

 多元线性回归预测模型一般公式为:

  \hat{Y}_t=a+b_1 x_1+b_2 x_2+b_3 x_3+\ldots+b_n x_n

    式中:

    \hat{Y}_t :因变量;

  x1,x2……:两个不同自变量,即与因变量有紧密联系的影响因素。

  a,b1,b2……:是线性回归方程的参数。

 通过回归分析预测得出模型需要两个检验。

 一、F检验

 F检验又叫方差齐性检验。在两样本t检验中要用到F检验。

 从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t检验或变量变换或秩和检验等方法。

 其中要判断两总体方差是否相等,就可以用F检验。

 回归平方和SSR表示Y估计值与平均值之差的平方和,其自由度为自变量个数p;残差平方和SSE表示Y的实际观测值与估计值之差的平方和,其自由度为观察次数n与自变量个数p之差减1,即使n-p-1。

 回归方程线性是否显著:

       原假设H0:b1=b2=b3=……=0

       备择假设H1:b1、b2、b3……至少有一个不为0。

 F=(SSR/p)/[SSE/(n-p-1)]

 F服从分子p个自由度、分母n-p-1个自由度的F分布。

 若F<=Fα,表明SSR比较小,估计值与平均值比较接近,说明各自变量系数在(1-α)的置信度内服从原假设;如果F>Fα,则放弃原假设,有(1-α)的置信度选择备择假设,证明至少一个系数不为0,回归方程是线性显著的。

 二、t检验

 系数bi的估计值与其标准差的商服从t分布。

        T=(bi估计值)/(bi估计值的标准差)

 根据大数定律,bi估计值服从正态分布,其标准差是多个正态分布的平方和除以次数,故服从t分布.

      原假设:bi=0

      备择假设:bi不为0

 如果bi=0,则bi估计值与实际值0之差越小,越能相信原假设,反之则相信备择假设。

 则如果T>Tα,则相信备择假设,有(1-α)置信度相信该系数不为0;如果T<=Tα,则说明该系数为0,该自变量不能影响因变量Y。

参考:http://blog.sina.com.cn/s/blog_5c2cfefb0100ej3p.html

bapleliu
粉丝 1
博文 290
码字总数 377862
作品 0
青岛
高级程序员
私信 提问
加载中
请先登录后再评论。
线性回归详解 

线性回归详解 课程观看地址:http://www.xuetuwuyou.com/course/155 课程出自学途无忧网:http://www.xuetuwuyou.com 详细的阐述了线性回归的原理及具体应用和案例,方便学员可以系统的得知线...

开源老大哥
2016/10/19
30
0
机器学习九大算法---回归

机器学习九大算法---回归 转自:http://blog.csdn.net/xiaohai1232/article/details/59551240 回归分析即,量化因变量受自变量影响的大小,建立线性回归方程或者非线性回归方程,从而达对因变...

osc_dst9rn7q
2018/08/06
2
0
线性相关|回归分析|

生物统计学-----相关与回归 描述和预测统计之后,相关与回归预测变量之间的关系。 相关关系是变量间关系不能用函数精确表达,即不一一对应而是点分布在直线周围。 评价指标是相关系数,有总体...

osc_j6x7mc4h
2019/10/13
2
0
Streamline: 统计学学习与进阶

[关于统计学专业的学习进阶] Introductory1.1 Introduction to Statistical Reasoning  统计学概念(实验设计、描述统计、相关和回归、概率、抽样、机会模型、显著性检验等)  1.2 Intro...

osc_ld3u7lka
2018/07/28
4
0
Python回归分析五部曲(二)—多重线性回归

多重线性回归(Multiple Linear Regression) 研究一个因变量与多个自变量间线性关系的方法 在实际工作中,因变量的变化往往受几个重要因素的影响,此时就需要用2个或2个以上的影响因素作为自...

osc_dh0xu7zu
2018/01/04
3
0

没有更多内容

加载失败,请刷新页面

加载更多

YGC问题排查,又让我涨姿势了!

在高并发下,Java程序的GC问题属于很典型的一类问题,带来的影响往往会被进一步放大。不管是「GC频率过快」还是「GC耗时太长」,由于GC期间都存在Stop The World问题,因此很容易导致服务超时...

erlieStar
昨天
0
0
碰上这4种项目经理,项目必死无疑

项目经理不是谁想当就能当的,除了精通业务,至少懂一些基础的技术知识外,还要拥有“项目经理式的人格”。 比如:任务导向、目标意识、高效、灵活、计划性强等。 而与之相对的,有四种类型的...

logiter
2019/12/20
0
0
Oracle 11g 数据库的部署

新手入门之Oracle 11g部署 Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目...

开源仔
13分钟前
0
1
整理 Linux下列出目录内容的命令

在 Linux 中,有非常多的命令可以让我们用来执行各种各样的任务。当我们想要像使用文件浏览器一样列出一个目录下的内容时,大家第一时间想到的是 ls 命令。但只有 ls 命令能实现这个目的吗?...

osc_q7wo0k6s
13分钟前
8
0
漫画:什么是SnowFlake算法?

本文转载自公众号 [程序员小灰] ————— 第二天 ————— 方法一:UUID UUID是通用唯一识别码 (Universally Unique Identifier),在其他语言中也叫GUID,可以生成一个长度32位的全局唯一...

无敌码龙
2019/03/21
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部