文档章节

数据分析学习之路——(一)初衷

Nekyo
 Nekyo
发布于 2017/08/11 21:49
字数 1332
阅读 328
收藏 7

       毕业以来一直在做web系统开发,主要为证券、基金公司等金融公司机构做呼叫中心产品开发,总的来说比较顺风顺水。但是很清楚自己不适合做纯开发工作,再加上对接触的客服业务也几乎不感兴趣,于是想着要改变,年轻多踩点坑没坏处!

       曾经一度想找一份互联网产品经理的工作,但是产品经理工作思维并非是自己私下能学得好的。能把axure、viso、思维导图等软件自学到比较熟练,能写一份比较全面的竞品分析报告,对于一个非互联网行业的人来说私下学习到这样大概就很厉害了吧,但是产品思维却是非实际项目经历不能培养的,任凭看再多文章,看再多报告也是一头雾水。于是就这样放弃了。年初的时候突然冒出进入大数据行业的念头,正好有大学同学也在做机器学习,经交流我就决定入这个坑——数据分析。对于有技术背景的我来讲,这个转型比产品经理容易得多。

       入行数据分析,要掌握哪些技能呢?于是我去拉钩等招聘网站查看数据分析的招聘要求,发现重合得最多的技能要求就是计算机/统计学专业,掌握excel/spass/R等分析工具,掌握mysql/oracle等数据库,会python开发语言。当然更高级一点的是要求掌握大数据工具spark/hadoop,熟悉常见的统计分析方法及模型、算法,数据挖掘等。我根据自己的基础和需求,选择了掌握python的技术型数据分析道路(业务型数据分析在很多企业主要以数据分析运营为主),于是将入门数据分析的技能要求分成几个方面进行学习:统计学概率论知识、python数据获取/清洗/分析、数据库操作(mysql/oracle)、数据分析思维、Excel操作、数据挖掘/机器学习。

       关于学习,每天下班后我只是用双眼盯着看,最多哪里不太理解多去想一想,稍微记下不懂的地方。后来发现这种方式效率太低,过一个月几乎就忘记学过的东西。于是后面我开始制定学习计划,并不要具体到某一天要做些什么,只需要列出最近要学习的内容,然后排日期,每天按照计划去做就行,记住:要记得当天设个时间点提醒任务是否完成。再有就是,我一般每天学习一个章节,晚上我会回顾当天的内容,然后用思维导图的形式将主要的知识点列出来,很有逻辑和层次性。这样不管是加深知识理解,还是以后复习都很有帮助。

统计学概率论知识

       数据分析必须具备的理论知识,主要了解概率、样本/总体、离散/连续型数据的分布、假设检验等相关概念和计算。我通过两本书来学习:《深入浅出统计学》《商务与经济统计》,相对来讲后者作为经典教材,讲解更细致。

python数据获取/清洗/分析

      由于我有两年web开发经验,所以我学习python几乎没什么障碍,在runoob.com看了一下基础语法,从最后的100个例子中选了一部分自己实现就算python入门了。数据分析python用到最多的库是numpy、pandas、scipy和matplotlib,我选择了经典的《利用Python进行数据分析》学习数据分析库的使用。再往后又去学习数据获取——爬虫,并接触了Scrapy爬虫框架,并实践了一个小项目(从链家网爬取数据并分析)。numpy和pandas用来做数据规整和清理,统计分析需要用到scipy库,matplotlib用来进行数据的最基本的可视化;高级可视化可以用basemap,wordcloud等。

数据库操作

       如上所述,工作期间使用oracle,已经掌握了基本操作,因此未安排这方面的学习。

数据分析思维

       关于分析思维说实话我自己都没有,这个要在实际工作中形成。我仅仅是走马观花翻看了一些书,并没有太明显的感触。

Excel操作

      其实excel并不难,只是一些函数和功能的操作问题,熟练了就好。这里推荐个教程 如何快速成为数据分析师?—秦路的回答 ,里面通过6篇文章讲了excel的使用。

数据挖掘/机器学习

      高阶的数据分析过程,我还没有接触,建议指导书籍:《数据挖掘导论》《数据挖掘》《机器学习》《集体编程智慧》等重量书籍。

      以上只是我刚刚准备入门的粗浅理解,数据分析是一门很综合的技能,作为大数据行业的敲门砖还不错的。

© 著作权归作者所有

Nekyo
粉丝 25
博文 11
码字总数 25764
作品 0
杭州
程序员
私信 提问
加载中

评论(0)

Python数据分析学习日志(1. 书单)

本人简介,2017年于北京交通大学毕业,电气硕士。 对数据分析很感兴趣,便开始学习利用Python进行数据处理,今后如有工作需要可能会涉及R语言。 ------------------------------------------...

osc_30db5uqw
2018/04/14
4
0
【奥斯卡理财星体系 第一章】丨你该如何找到理财正确的方向

学习理财良久,依然没有头绪? 有没有简洁明了,循序渐进的课程,能够让我少走弯路,早日变为理财达人呢? 从一个完全的理财小白一路取经的奥斯卡,将手把手教你从零开始建立理财体系! 写在...

osc_44fs053n
2018/06/15
3
0
Prometheus监控学习记录

官方文档 Prometheus基础文档 从零开始:Prometheus 进阶之路:Prometheus —— 技巧篇 进阶之路:Prometheus —— 理解篇 prometheus的数据类型介绍 Prometheus 查询语言 Prometheus 函数 ...

osc_ju7lpfoo
2019/01/31
10
0
深度学习笔记7:Tensorflow入门

欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定! 对商业智能BI、大数据分析挖掘、机器学习,python,R等数据领域感兴...

天善智能
2018/07/23
0
0
1月11日云栖精选夜读:阿里安全资深专家杭特谈安全圈之“怪现状”

使“数据”自身变得“攻不可破,盗不可用”,才是安全的最终目的。 热点热议 阿里安全资深专家杭特谈安全圈之“怪现状” 作者:华蒙 发表在: 阿里安全 还有这种操作?既是黑客又是居家男的阿...

yq传送门
2018/01/11
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Python基础-04元组

4.元组     元组的主要特性为: 1.元组在创建之后,具有不可以更改的特性,因此不能直接给元组的元素赋值 2.元组的元素类型可以为任意类型,如字典、字符串、列表等 3.元组常用于在程序的整...

osc_b2jll5m6
10分钟前
12
0
怎么在流程图中插入超链接?迅捷画图带你两步解决!

怎么在流程图中插入超链接?如何在WORD中插入超链接很多人都知道,但是对于陌生的流程图,很多人在进行流程图展示和讲解的时候,都会选择提前将需要的网页打开,然后手动进行更换。 这种手动...

真不莲
11分钟前
8
0
直播中音视频处理的一般流程

数据采集→数据编码→数据传输(流媒体服务器) →解码数据→播放显示 1、数据采集: 摄像机及拾音器收集视频及音频数据,此时得到的为原始数据 涉及技术或协议: 摄像机:CCD、CMOS 拾音器:声...

图玩智能科技
12分钟前
6
0
IntelliJ中的main函数和System.out.println()快捷键

https://blog.csdn.net/shijiebei2009/article/details/44726433

诗书易经
12分钟前
9
0
python 数据可视化实战(1)折线图绘制

  本篇博客新开一个数据分析后的数据可视化的例子讲解,每一篇博客是一个例子。   这节课学习如何绘制一个折线图。题目如下:   代码如下: import matplotlib.pyplot as pltimport m...

osc_xdc1vjza
12分钟前
8
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部