文档章节

回归模型及回归方程

不愿透露性别的某名宿
 不愿透露性别的某名宿
发布于 2017/07/26 00:08
字数 982
阅读 5
收藏 0
  • 回归分析主要解决的问题
a、从一组样本数据出发,确定变量之间的数学关系式
b、关系式的可信度进行检验,并找出哪些变量的影响是显著,哪些是不显著的
c、利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度

  • 回归模型
  • 自变量与因变量
被预测或被解释的变量,称为因变量,用y表示;
用来预测或解释因变量的一个或者多个变量称为自变量,用x表示;

  • 一元回归、一元线性回归
一元回归:一个自变量
一元线性回归:线性关系

  • 回归模型
描述因变量 y 如何依赖与自变量 x 和 误差项   的方程称为回归模型
 

 +    反应了由于X的变化而引起的Y的线性变化,  称为模型的参数

 被称为误差项的随机变量,反映了除 X 和 y 之间的线性关系之外的随机因素对y的影响,是不能由x和y之间的线性关系所解释的变异性 ,


  • 上述为理论回归模型,其部分假定


a、因变量 y 与 x 有线性关系


b、重复抽样中,自变量 x 的取值是固定的,即假定 x 是非随机的

    上述两个假定下,对于任意个给定的 x 值,y 的取值都对应着一个分布,因此, E(y) =  +  代表一条直线,但由于单个数据点是从 y  的分布中抽出来的,可能不在这条直线上,因此,必须包含一个误差  来描述模型的数据点


c、误差项  是一个期望值为0 的随机变量,即 E() = 0。,上述式子中,由于都为常数,所以有 E() =  ,E() =  。

    因此对于一个给定的 x 值,y 的期望值为 E(y) =  +  。这实际上等于假定模型的形式为一条直线


d、对于所有的 x 的值, 的方差        都相同,这以为这对应一个特定 x值,y 的方差也都是等于   


e、误差项  服从正态分布的随机变量,且独立,即  ~N(0,

    1、独立性意味着一个特定的 x 值,它所对应的  与其他 x 值所对应的  不相关 ,所因此,对于一个特定的 x 值,他所对应的 y 值与其他 x 所对应的 y 值也不相关

    2、这表明, 在 x 取某个确定值的情况下,y 的变化由误差项  的方差  来决定

    3、当  较小时,y 的观测值非常靠近直线

         当  较大时,y 的观测值偏离直线 

         由于  是常数,y 的取值不受 x 取值的影响

    4、由于自变量 x 在数据收集前假设是固定的,因此,对于任何一个给定的 x 值, y 都 服从期望值为  +  、方差为  的正态分布,对于不同的 x 具有相同的方差


关于回归模型的假定,如下图

 


  • 回归方程

根据回归模型的假定, 的期望值等于0 ,因此E(y) =  +  

描述因变量 y 的期望值如何依赖与自变量 x 的方程称为回归方程 ,一元线性回归方程

 

E(y) =  +  


a、图示是一条直线,也称为直线回归方程

b、 :y轴上的截距,x = 0时 y 的期望值, 斜率: x 每变动一个单位, y 的平均变动值为


  • 估计的回归方程

用样本统计量      代替回归返程中的未知参数,    这时就得到了估计的回归方程

 =     +   


:截距, 斜率,表示 x 每变动一个单位时, y 的平均变动值





© 著作权归作者所有

共有 人打赏支持
不愿透露性别的某名宿
粉丝 0
博文 310
码字总数 183957
作品 0
深圳
其他
私信 提问
一元(多元)线性回归分析之Excel实现

工作中最常用、最简单的估计就是一元(多元)线性回归分析了,比如预测销量等,今天来分享一下Excel的实现方法。 1. 一元线性回归 先说一元:使用R语言中的women数据集,记录了15为女性的身高...

okajun
2018/05/05
0
0
sklearn学习笔记之简单线性回归

简单线性回归 线性回归是数据挖掘中的基础算法之一,从某种意义上来说,在学习函数的时候已经开始接触线性回归了,只不过那时候并没有涉及到误差项。线性回归的思想其实就是解一组方程,得到...

云栖希望。
2017/12/30
0
0
一元(多元)线性回归分析之R语言实现

上篇介绍了《一元(多元)线性回归分析之Excel实现》,本篇来探讨一下回归分析在R语言中的实现,我们将从更专业的角度对模型进行一些解读。 1. 一元线性回归 同样,我们仍然使用R中自带的wom...

okajun
2018/05/10
0
0
吴恩达机器学习笔记(2)——多变量线性回归

上一篇我们提到了单变量的线性回归模型,但是我们实际遇到的问题,都会有多个变量影响,比如上篇的例子——房价问题,在实际情况下影响房价的一定不止房子的面积,房子的地理位置,采光度等等...

机智的神棍酱
2018/06/18
0
0
回归方程的拟合优度-多重判定系数-估计标准误差

多重判定系数与调整的多重判定系数 SST = SSR + SSE 式中 为总平方和 SSR = 为回归平方和 SSE = 为残差平方和 = SSR/SST = 1- SSE/SST 说明 a、多重判定系数反应反映了因变量 y 的变差中估计...

不愿透露性别的某名宿
2017/07/26
0
0

没有更多内容

加载失败,请刷新页面

加载更多

如何在 Linux 系统查询机器最近重启时间

在你的 Linux 或类 UNIX 系统中,你是如何查询系统上次重新启动的日期和时间?怎样显示系统关机的日期和时间? last 命令不仅可以按照时间从近到远的顺序列出该会话的特定用户、终端和主机名...

来来来来来
30分钟前
0
0
Redis协议是什么样的

前言 我们用过很多redis的客户端,有没有相过自己撸一个redis客户端? 其实很简单,基于socket,监听6379端口,解析数据就可以了。 redis协议 解析数据的过程主要依赖于redis的协议了。 我们...

春哥大魔王的博客
47分钟前
2
0
乱入Linux界的我是如何学习的

欢迎来到建哥学Linux,咳!咳!咳!开个玩笑哈,我是一个IT男,IT界的入门选手,正在学习Linux。 在之前,一直想进军IT界,学习IT技术,但是苦于没有人指导,也不知道学什么,最开始我自己在...

linuxCool
今天
1
0
携程Apollo统一配置中心的搭建和使用(java)

一.Apollo配置中心介绍 1、What is Apollo 1.1 Apollo简介 Apollo(阿波罗)是携程框架部门研发的开源配置管理中心,能够集中化管理应用不同环境、不同集群的配置,配置修改后能够实时推送到...

morpheusWB
今天
1
0
远程获得的有趣的linux命令

使用这些工具从远程了解天气、阅读资料等。 我们即将结束为期 24 天的 Linux 命令行玩具日历。希望你有一直在看,如果没有,请回到开始,从头看过来。你会发现 Linux 终端有很多游戏、消遣和...

Linux就该这么学
今天
6
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部