文档章节

相关系数

不愿透露性别的某名宿
 不愿透露性别的某名宿
发布于 2017/07/26 00:08
字数 570
阅读 2
收藏 0
  • 相关系数
根据样本数据计算的度量两个变量之间线性关系强度的统计量
    a、根据总体全部数据计算,称为总体相关系数,记作 
    b、若是根据样本数据计算的,称为样本相关系数,记作 r

  • 相关系数的性质
a、r的取值范围[-1,1],即-1 <= r <=1
    1、0 < r <=1,        x与y之间存在正线性相关关系
    2、-1 <= r < 0,      x与y之间存在负线性相关关系
    3、r = -1                 x与y之间完全负线性相关关系
    4、r = 0                  y的取值与x无关,二者之间不存在线性相关关系
    5、| r |=1                y的取值完全依赖与x,二者之间即为函数关系

b、r数值的大小与x与y的原点及尺度无关,改变x和y的数据原点及计量尺度,并不改变r的数值大小

c、r具有对称性,x与y之间的相关系数 和y与x之间的相关系数相等,即        = 

d、r仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系
    1、r =0,x与y之间不存在线性关系,不能说明两个变量不存在任何关系,因为有可能有非线性关系
    2、变量之间非线性关系程度较大时,可能会导致 r =0
    3、r =0 或者很小时,不能轻易的得出两个变量之间不存在关系的结论,应该结合散点图做出合理的解释

e、r虽然是两个变量之间线性关系的一个度量,却不意味着x与y一定有因果关系

  • 相关强度
a、r的取值一般在 -1 ~ 1之间, | r |-->1说明两个变量之间的线性关系越强;| r | -->0 说明两个变量之间的线性关系越弱

b、当 | r | >= 0.8            可视为高度相关
      当 0.3 <= | r | <0.5 可视为低度相关
      当 | r | < 0.3              说明两个变量之间的相关程度积弱,可视为不相关
注:这种解释必须建立在对相关系数的显著性进行检验的基础之上







© 著作权归作者所有

共有 人打赏支持
不愿透露性别的某名宿
粉丝 0
博文 310
码字总数 183957
作品 0
深圳
其他
统计挖掘那些事(四)-9个相关R先生的故事(理论+动手案例)

作者简介 浩彬老撕,R语言中文社区特邀作者,好玩的IBM数据工程师,立志做数据科学界的段子手。 个人公众号:探数寻理 往期回顾: 统计挖掘的一些事一些情(一) 统计挖掘的一些事一些情(二...

R语言中文社区
06/13
0
0
四分格相关系数的标准差及显著性检验

http://www.john-uebersax.com/stat/tetra.htm 提到可用两种方法做四分格相关系数的显著性检验,这里用到的是第一种方法,也就是利用标准差的检验. <The Tetrachoric Correlation and its Asym...

遥远的路程
2014/10/24
0
0
Pearson相关系数, Spearman相关系数,Kendall相关系数的区别

http://www.psydoor.com/thread-40650-1-1.html

wqhlmark64
2017/10/25
0
0
距离有多远?欧几里德距离&皮尔逊相关度系数

我们对同样的一些电影,书,音乐进行评分,从这些评分中能看到我们彼此之间的相似度么?说到这里你可能会想到豆瓣,我们有没有方法来模仿豆瓣计算这种相似度呢?本文是《集体智慧编程》介绍相...

唐玄奘
2017/12/04
0
0
【推荐系统notes】python实现最简单的推荐系统(附完整代码)

数据介绍 影片csv格式数据 相似度系数使用场景比较 如果数据存在“分数膨胀”问题,就使用皮尔逊相关系数。 如果数据比较“密集”,变量之间基本都存在公有值,且这些距离数据是非常重要的,那就...

小透明苞谷
2017/12/08
0
0

没有更多内容

加载失败,请刷新页面

加载更多

React 服务器渲染原理解析与实践

网盘下载地址 React 服务器渲染原理解析与实践 本套课程,讲解了React中SSR技术的整个搭建思路及流程,完整的从原理上讲清楚了SSR的概念,重点在于讲解编写SSR框架遇到的各种知识点,以及细节...

qq__2304636824
41分钟前
0
0
Jenkins使用

clean install -Dmaven.test.skip=true

1713716445
50分钟前
0
0
多线程

1. 多线程概念。并发和并行的概念。 多线程指的是一段时间内cpu同时执行多个线程。一个程序至少运行>=1个进程,进程就是运行中的程序,而一个进程至少运行>=1个线程,线程是操作系统能调度的...

鱼想吃肉
今天
1
0
HBase 表修复在线方式和离线方式

一、在线修复 1.1 使用检查命令 $ ./bin/hbase hbck 该命令可完整修复 HBase 元数据信息;存在有错误信息会进行输出; 也可以通过如下命令查看详细信息: $ ./bin/hbase hbck -details 1.2 ...

Ryan-瑞恩
今天
3
0
redis 系列二 -- 常用命令

1.基础命令 info ping quit save dbsize select flushdb flushall 2.键命令 2.1 set 直接赋值 set a a 2.2 get 取值 get a 2.3 exists 是否存在 exists a 2.4 expire 设置剩余时间 秒 expire......

imbiao
今天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部