文档章节

数据分析学习笔记(教材篇)

灰大羊
 灰大羊
发布于 2016/08/06 22:46
字数 815
阅读 93
收藏 5

最近在学习数据科学方面的内容,因为是自学,身边也没有靠谱的老司机带着,工作又不相关,所以只能一点点的摸索。

这篇笔记主要用于罗列一些自学过程中使用的教材和在线课程,并会简要的说明一下对应教材的学习心得。

深入浅出数据分析

Head First系列教程可以说,一直是作为“白板”入门某一领域的首选教材。我在工作之余,用了一周的时间把这本书读完了。

相对来说,在读这本书的时候,如果顺着作者的思路,边读边思考,那么对于数据分析来说,至少会有一个较为直观的印象。不过,要想靠着这本书,达到什么样的程度,很显然是不现实的。

此书主要分为以下几个部分:

  1. 分解数据:介绍了基本的数据分析的流程,「确定目标」「分解目标/数据」「评估并形成结论」「形成决策性建议」。
  2. 实验:介绍了在目标明确的时候,如何使用「随机选择」「关键因素」两个概念来设立合理的实验组以及控制组,从而达到分析选择不同的「实验参数」对实验结果的影响。
  3. 最优化:介绍了如何结合「目标函数」以及多组「制约因素」来得出最优化的结论。
  4. 数据图形化:介绍了对于数据分析来说,为什么「简洁」「直接」「可读」的数据图形是数据分析和决策支持的关键。
  5. 假设检验:介绍了使用「证伪法」来对「备选答案」进行「排除/筛选」。
  6. 贝叶斯统计:介绍了「贝叶斯统计」在数据分析的作用/应用,以及简单使用。
  7. 主观概率:介绍了在没有数据形成概率的时候,如何使用「关键干系人主观概率判断」来进行数据分析,以及如何使用「贝叶斯统计」来修正主观概率的结果。
  8. 启发法:介绍了如何应用多方的「主观推理逻辑/决策树」的「合理交叉点」,来找到合理的「分析点」,从而展开关键数据的收集和分析/挖掘。
  9. 直方图:介绍了直方图的应用场景,以及对于数据的「分布」「差异」「集中」三种趋势如何应用「标准差」进行分析。
  10. 回归:介绍了什么是「回归线」,以及如何从「散点图」中如何利用「均值」来生成「回归线」,并说明「回归线」对于「预测」的重要作用。
  11. 误差:介绍了为什么使用「回归线预测」的结果「不够准确」,以及如何应用「均方根误差」和「合理分区」来优化「回归线预测」。
  12. 关系数据库:介绍了如何将几张有关联关系的数据表格抽取及合并成我们所需要的数据表格,以及为什么使用关系型数据库。
  13. 整理数据:介绍了如何从非格式化数据整理到格式化数据的过程(主要是合理分列)。

© 著作权归作者所有

共有 人打赏支持
灰大羊
粉丝 4
博文 96
码字总数 95147
作品 0
浦东
项目经理
私信 提问
R语言中文社区10篇最火的文章 | 2017大盘点

岁末年终,到了该谈终结的时候。 对此,小编特别精选出10篇,这一年来R社区最火的文章(阅读量最高),分享给一直默默关注社区的你们。 第十名: 如何七周成为数据分析师 “写这个系列,是希...

kmd8d5r
2017/12/30
0
0
十分钟读懂python的“数据库”语言

JOIN可以用或执行。默认情况下, 将在其索引中加入DataFrame。每个方法都有参数,允许您指定要执行的联接类型(LEFT,RIGHT,INNER,FULL)或要联接的列(列名称或索引)。 假设我们有两个与...

frbevrqbn4l
2017/11/09
0
0
python执行各种sql语句,让你分析数据更简洁

由于许多潜在的pandas用户对SQL有一定的了 解 ,因此本页旨在提供一些使用pandas来执行各种SQL操作的示例。 大部分的例子将利用在pandas测试中发现的数据集。我们将数据读入一个名为tips的D...

frbevrqbn4l
2017/11/07
0
0
机器学习(Machine Learning)&深度学习(Deep Learning)资料(上)

该资源的github地址:Qix 《Brief History of Machine Learning》 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning...

ty4z2008
2015/03/18
0
0
机器学习基础篇--监督学习经典案例(Python实现)

机器学习基础篇--监督学习监督学习经典案例 前几章讲过,机器学习监督学习模型的任务重点在于,根据已有的经验知识对未知样本的目标/标记进行预测。根据目标预测变量的类型不同,我们把监督学...

frbevrqbn4l
2017/10/24
0
0

没有更多内容

加载失败,请刷新页面

加载更多

传统IDC部署网站(三)

11. 重置密码 密钥和密码都支持远程登陆, 二选一 两个都可以登陆, 密钥相对于密码来说,相对安全一点 本地登陆无法是用密钥 修改密码 root 用户 passwd root 修改普通用户 passwd usernam...

miko0089
30分钟前
2
0
日志服务与SIEM(如Splunk)集成方案实战

背景信息 目标 本文主要介绍如何让阿里云日志服务与您的SIEM方案(如Splunk)对接, 以便确保阿里云上的所有法规、审计、与其他相关日志能够导入到您的安全运维中心(SOC)中。 名词解释 LOG(S...

阿里云官方博客
34分钟前
2
0
bash特性

1.支持别名 alias 2.命令替换 $(COMMANS) 或者 `COMMAND` 3. bash支持的引号: `` :命令替换 "":弱引用,可以实现变量替换 '':强引用,不实现变量替换 4.文件名通配 globbing:(man 7 glo...

忙碌的小蜜蜂
39分钟前
2
0
以语音评测的PC端demo代码为例,讲解口语评测如何实现

本文由云+社区发表 作者:腾讯智慧教育 概述 腾讯云智聆口语评测(英文版)(Smart Oral Evaluation-English,SOE-E)是腾讯云推出的语音评测产品,是基于英语口语类教育培训场景和腾讯云的语...

腾讯云加社区
51分钟前
1
0
浅谈SpringMVC之DispatcherServlet

Spring的MVC框架是围绕一个DispatcherServlet其实就是个Servlet(它继承自HttpServlet基类)来设计的, 它支持可配置的处理器映射、视图渲染、本地化、时区与主题渲染、文件上传等 控制器一般...

恋码之子
54分钟前
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部