文档章节

回归模型及回归方程

不愿透露性别的某名宿
 不愿透露性别的某名宿
发布于 2017/07/26 00:08
字数 982
阅读 180
收藏 0

精选30+云产品,助力企业轻松上云!>>>

  • 回归分析主要解决的问题
a、从一组样本数据出发,确定变量之间的数学关系式
b、关系式的可信度进行检验,并找出哪些变量的影响是显著,哪些是不显著的
c、利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度

  • 回归模型
  • 自变量与因变量
被预测或被解释的变量,称为因变量,用y表示;
用来预测或解释因变量的一个或者多个变量称为自变量,用x表示;

  • 一元回归、一元线性回归
一元回归:一个自变量
一元线性回归:线性关系

  • 回归模型
描述因变量 y 如何依赖与自变量 x 和 误差项   的方程称为回归模型
 

 +    反应了由于X的变化而引起的Y的线性变化,  称为模型的参数

 被称为误差项的随机变量,反映了除 X 和 y 之间的线性关系之外的随机因素对y的影响,是不能由x和y之间的线性关系所解释的变异性 ,


  • 上述为理论回归模型,其部分假定


a、因变量 y 与 x 有线性关系


b、重复抽样中,自变量 x 的取值是固定的,即假定 x 是非随机的

    上述两个假定下,对于任意个给定的 x 值,y 的取值都对应着一个分布,因此, E(y) =  +  代表一条直线,但由于单个数据点是从 y  的分布中抽出来的,可能不在这条直线上,因此,必须包含一个误差  来描述模型的数据点


c、误差项  是一个期望值为0 的随机变量,即 E() = 0。,上述式子中,由于都为常数,所以有 E() =  ,E() =  。

    因此对于一个给定的 x 值,y 的期望值为 E(y) =  +  。这实际上等于假定模型的形式为一条直线


d、对于所有的 x 的值, 的方差        都相同,这以为这对应一个特定 x值,y 的方差也都是等于   


e、误差项  服从正态分布的随机变量,且独立,即  ~N(0,

    1、独立性意味着一个特定的 x 值,它所对应的  与其他 x 值所对应的  不相关 ,所因此,对于一个特定的 x 值,他所对应的 y 值与其他 x 所对应的 y 值也不相关

    2、这表明, 在 x 取某个确定值的情况下,y 的变化由误差项  的方差  来决定

    3、当  较小时,y 的观测值非常靠近直线

         当  较大时,y 的观测值偏离直线 

         由于  是常数,y 的取值不受 x 取值的影响

    4、由于自变量 x 在数据收集前假设是固定的,因此,对于任何一个给定的 x 值, y 都 服从期望值为  +  、方差为  的正态分布,对于不同的 x 具有相同的方差


关于回归模型的假定,如下图

 


  • 回归方程

根据回归模型的假定, 的期望值等于0 ,因此E(y) =  +  

描述因变量 y 的期望值如何依赖与自变量 x 的方程称为回归方程 ,一元线性回归方程

 

E(y) =  +  


a、图示是一条直线,也称为直线回归方程

b、 :y轴上的截距,x = 0时 y 的期望值, 斜率: x 每变动一个单位, y 的平均变动值为


  • 估计的回归方程

用样本统计量      代替回归返程中的未知参数,    这时就得到了估计的回归方程

 =     +   


:截距, 斜率,表示 x 每变动一个单位时, y 的平均变动值





不愿透露性别的某名宿
粉丝 1
博文 310
码字总数 183957
作品 0
深圳
其他
私信 提问
加载中
请先登录后再评论。
R语言 多重回归

多元回归是线性回归到两个以上变量之间的关系的延伸。 在简单线性关系中,我们有一个预测变量和一个响应变量,但在多元回归中,我们有多个预测变量和一个响应变量。 多元回归的一般数学方程为...

qq_38131668
2018/04/24
0
0
机器学习(八) 多项式回归与模型泛化(上)

一、什么是多项式回归 直线回归研究的是一个依变量与一个自变量之间的回归问题,但是,在畜禽、水产科学领域的许多实际问题中,影响依变量的自变量往往不止一个,而是多个,比如绵羊的产毛量...

osc_w9nfnvz4
2018/08/31
5
0
一元(多元)线性回归分析之Excel实现

工作中最常用、最简单的估计就是一元(多元)线性回归分析了,比如预测销量等,今天来分享一下Excel的实现方法。 1. 一元线性回归 先说一元:使用R语言中的women数据集,记录了15为女性的身高...

okajun
2018/05/05
0
0
matlab-线性回归

1.调用函数regress(Y,X,alpha),plpha是置信度,如果直接用regress(Y,X)则默认置信度为0.05,Y是一个 的列向量,X是一个 的矩阵,其中第一列是全1向量。 2.函数返回值及意义 b 回归系数,是一...

osc_2h38v7rr
2019/08/06
1
0
7种回归模型

【编者按】回归分析是建模和分析数据的重要工具。本文解释了回归分析的内涵及其优势,重点总结了应该掌握的线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、ElasticNet回归等七...

安小北north
2017/03/09
0
0

没有更多内容

加载失败,请刷新页面

加载更多

西安索命拉土车!(又遇上一场车祸)

西安是一座厚重的古城。 1、拉土车 大家知道我是陕西人,现在也定居到西安。 其实在2010-2013年在西安工作过3年,那段时间真的是见识到了西安拉土车的疯狂。 那时候西安软件园还比较偏僻,高...

osc_1ls4yaq1
14分钟前
6
0
大牛聊Java并发编程原理之 线程的互斥与协作机制

可能在synchronized关键字的实现原理中,你已经知道了它的底层是使用Monitor的相关指令来实现的,但是还不清楚Monitor的具体细节。本文将让你彻底Monitor的底层实现原理。 管程 一个管程可以...

osc_9gohs268
16分钟前
8
0
Linux进程内存管理对程序开发者的影响详谈

本章首先以应用程序开发者的角度审视Linux的进程内存管理,在此基础上逐步深入到内核中讨论系统物理内存管理和内核内存的使用方法。力求从外到内、水到渠成地引导网友分析Linux的内存管理与使...

linuxprobe2020
17分钟前
15
0
小伙子,你懂线程池的创建吗?

为什么阿里巴巴要禁用Executors创建线程池?看阿里巴巴开发手册并发编程这块有一条:线程池不允许使用Executors去创建,而是通过ThreadPoolExecutor的方式,通过源码分析禁用的原因 一、线程...

osc_uie90flw
17分钟前
9
0
Java连载129-广播数据包、网络编程总结

一、广播数据包 1.特性 这种通信类似于广播,要想实现这个功能,需要使用特殊的IP地址,要想实现多播或者广播通信的主机必须加入一个D类地址,D类地址的十进制表示范围为224.0.0.0~239.255.2...

osc_8nnvoyb1
18分钟前
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部