文档章节

数据分析学习之路——(一)初衷

Nekyo
 Nekyo
发布于 2017/08/11 21:49
字数 1332
阅读 161
收藏 6
点赞 0
评论 0

       毕业以来一直在做web系统开发,主要为证券、基金公司等金融公司机构做呼叫中心产品开发,总的来说比较顺风顺水。但是很清楚自己不适合做纯开发工作,再加上对接触的客服业务也几乎不感兴趣,于是想着要改变,年轻多踩点坑没坏处!

       曾经一度想找一份互联网产品经理的工作,但是产品经理工作思维并非是自己私下能学得好的。能把axure、viso、思维导图等软件自学到比较熟练,能写一份比较全面的竞品分析报告,对于一个非互联网行业的人来说私下学习到这样大概就很厉害了吧,但是产品思维却是非实际项目经历不能培养的,任凭看再多文章,看再多报告也是一头雾水。于是就这样放弃了。年初的时候突然冒出进入大数据行业的念头,正好有大学同学也在做机器学习,经交流我就决定入这个坑——数据分析。对于有技术背景的我来讲,这个转型比产品经理容易得多。

       入行数据分析,要掌握哪些技能呢?于是我去拉钩等招聘网站查看数据分析的招聘要求,发现重合得最多的技能要求就是计算机/统计学专业,掌握excel/spass/R等分析工具,掌握mysql/oracle等数据库,会python开发语言。当然更高级一点的是要求掌握大数据工具spark/hadoop,熟悉常见的统计分析方法及模型、算法,数据挖掘等。我根据自己的基础和需求,选择了掌握python的技术型数据分析道路(业务型数据分析在很多企业主要以数据分析运营为主),于是将入门数据分析的技能要求分成几个方面进行学习:统计学概率论知识、python数据获取/清洗/分析、数据库操作(mysql/oracle)、数据分析思维、Excel操作、数据挖掘/机器学习。

       关于学习,每天下班后我只是用双眼盯着看,最多哪里不太理解多去想一想,稍微记下不懂的地方。后来发现这种方式效率太低,过一个月几乎就忘记学过的东西。于是后面我开始制定学习计划,并不要具体到某一天要做些什么,只需要列出最近要学习的内容,然后排日期,每天按照计划去做就行,记住:要记得当天设个时间点提醒任务是否完成。再有就是,我一般每天学习一个章节,晚上我会回顾当天的内容,然后用思维导图的形式将主要的知识点列出来,很有逻辑和层次性。这样不管是加深知识理解,还是以后复习都很有帮助。

统计学概率论知识

       数据分析必须具备的理论知识,主要了解概率、样本/总体、离散/连续型数据的分布、假设检验等相关概念和计算。我通过两本书来学习:《深入浅出统计学》《商务与经济统计》,相对来讲后者作为经典教材,讲解更细致。

python数据获取/清洗/分析

      由于我有两年web开发经验,所以我学习python几乎没什么障碍,在runoob.com看了一下基础语法,从最后的100个例子中选了一部分自己实现就算python入门了。数据分析python用到最多的库是numpy、pandas、scipy和matplotlib,我选择了经典的《利用Python进行数据分析》学习数据分析库的使用。再往后又去学习数据获取——爬虫,并接触了Scrapy爬虫框架,并实践了一个小项目(从链家网爬取数据并分析)。numpy和pandas用来做数据规整和清理,统计分析需要用到scipy库,matplotlib用来进行数据的最基本的可视化;高级可视化可以用basemap,wordcloud等。

数据库操作

       如上所述,工作期间使用oracle,已经掌握了基本操作,因此未安排这方面的学习。

数据分析思维

       关于分析思维说实话我自己都没有,这个要在实际工作中形成。我仅仅是走马观花翻看了一些书,并没有太明显的感触。

Excel操作

      其实excel并不难,只是一些函数和功能的操作问题,熟练了就好。这里推荐个教程 如何快速成为数据分析师?—秦路的回答 ,里面通过6篇文章讲了excel的使用。

数据挖掘/机器学习

      高阶的数据分析过程,我还没有接触,建议指导书籍:《数据挖掘导论》《数据挖掘》《机器学习》《集体编程智慧》等重量书籍。

      以上只是我刚刚准备入门的粗浅理解,数据分析是一门很综合的技能,作为大数据行业的敲门砖还不错的。

© 著作权归作者所有

共有 人打赏支持
Nekyo
粉丝 20
博文 11
码字总数 25764
作品 0
杭州
程序员
阿里巴巴大数据计算平台MaxCompute(原名ODPS)全套攻略(持续更新20171127)

概况介绍 大数据计算服务(MaxCompute,原名ODPS,产品地址:https://www.aliyun.com/product/odps)是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供了完善的数据导入方...

隐林 ⋅ 2017/05/05 ⋅ 0

1月11日云栖精选夜读:阿里安全资深专家杭特谈安全圈之“怪现状”

使“数据”自身变得“攻不可破,盗不可用”,才是安全的最终目的。 热点热议 阿里安全资深专家杭特谈安全圈之“怪现状” 作者:华蒙 发表在: 阿里安全 还有这种操作?既是黑客又是居家男的阿...

yq传送门 ⋅ 01/11 ⋅ 0

我的安全之路——二进制与逆向篇

我的安全之路——二进制与逆向篇 write in my dormitory at ‏‎11:23:35 Saturday, May 20th, 2017 by giantbranch(一个当初想横跨web跟二进制的菜鸡) ————致即将毕业的自己。 上一篇...

u012763794 ⋅ 2017/07/23 ⋅ 0

R语言入门:大数据人才缺口巨大,现在学习还不晚

数据时代已经到来,但数据分析、数据挖掘人才却十分短缺,据全球顶尖管理咨询公司麦肯锡(McKinsey)一份详细分析报告显示: 预计到 2018 年,大数据或者数据工作者的岗位需求将激增,其中大...

bjweimengshu ⋅ 2017/12/15 ⋅ 0

推荐几个值得关注的技术公众号(年度精选)

牛客网 牛客网(网址:https://www.nowcoder.com)是一个面向程序员大学生的题库平台,包括了IT名企历年笔试真题,以及各类编程语言题库。扫描二维码后点击链接,进行注册,即可开始做题。 ...

bjweimengshu ⋅ 2017/12/29 ⋅ 0

【资料合集】2017云栖大会·北京峰会回顾合集:PDF下载

2017云栖大会·北京峰会于12月19-20日在北京国家会议中心召开,阿里云年度重磅发布集中登场,30多场主题论坛,百位技术专家深度解读大数据、人工智能、企业级互联网架构等行业前沿技术,并进...

yunqi_share ⋅ 2017/12/27 ⋅ 0

架构学习资料汇总

知名网站架构分析 探索Google App Engine背后的奥秘(1)–Google的核心技术 探索Google App Engine背后的奥秘(2)–Google的整体架构猜想 探索Google App Engine背后的奥秘(3)- Google App Eng...

peter8015 ⋅ 2016/04/22 ⋅ 0

重磅干货不容错过!2017云栖大会汇总资料,速来领取!

云栖大会由阿里巴巴集团主办已经成为全球云计算TOP级峰会汇聚DT时代最强大脑描绘云计算发展趋势和蓝图展现云计算、大数据、人工智能蓬勃发展的技术生态全景。2017云栖大会到此圆满结束聚焦技...

yunqi_share ⋅ 2017/12/28 ⋅ 0

D瓜哥分享的架构资料

扯扯蛋 以前见过零零散散地介绍一些知名网站架构的分析文章。最近D瓜哥也想研究一下各大知名网站的架构。所以,就搜集了一下这方面资料。限于时间问题,这篇文章分享的文章并没有都看完,所以...

hejunbinlan ⋅ 2015/09/06 ⋅ 2

大数据学习之路(持续更新中...)

在16年8月份至今,一直在努力学习大数据大数据相关的技术,很想了解众多老司机的学习历程。因为大数据涉及的技术很广需要了解的东西也很多,会让很多新手望而却步。所以,我就在自己学习的过...

青夜之衫 ⋅ 2017/12/05 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

vbs 取文件大小 字节

dim namedim fs, s'name = Inputbox("姓名")'msgbox(name)set fs = wscript.createobject("scripting.filesystemobject") 'fs为FSO实例if (fs.folderexists("c:\temp"))......

vga ⋅ 5分钟前 ⋅ 0

高并发之Nginx的限流

首先Nginx的版本号有要求,最低为1.11.5 如果低于这个版本,在Nginx的配置中 upstream web_app { server 到达Ip1:端口 max_conns=10; server 到达Ip2:端口 max_conns=10; } server { listen ...

算法之名 ⋅ 今天 ⋅ 0

Spring | IOC AOP 注解 简单使用

写在前面的话 很久没更新笔记了,有人会抱怨:小冯啊,你是不是在偷懒啊,没有学习了。老哥,真的冤枉:我觉得我自己很菜,还在努力学习呢,正在学习Vue.js做管理系统呢。即便这样,我还是不...

Wenyi_Feng ⋅ 今天 ⋅ 0

博客迁移到 https://www.jianshu.com/u/aa501451a235

博客迁移到 https://www.jianshu.com/u/aa501451a235 本博客不再更新

为为02 ⋅ 今天 ⋅ 0

win10怎么彻底关闭自动更新

win10自带的更新每天都很多,每一次下载都要占用大量网络,而且安装要等得时间也蛮久的。 工具/原料 Win10 方法/步骤 单击左下角开始菜单点击设置图标进入设置界面 在设置窗口中输入“服务”...

阿K1225 ⋅ 今天 ⋅ 0

Elasticsearch 6.3.0 SQL功能使用案例分享

The best elasticsearch highlevel java rest api-----bboss Elasticsearch 6.3.0 官方新推出的SQL检索插件非常不错,本文一个实际案例来介绍其使用方法。 1.代码中的sql检索 @Testpu...

bboss ⋅ 今天 ⋅ 0

informix数据库在linux中的安装以及用java/c/c++访问

一、安装前准备 安装JDK(略) 到IBM官网上下载informix软件:iif.12.10.FC9DE.linux-x86_64.tar放在某个大家都可以访问的目录比如:/mypkg,并解压到该目录下。 我也放到了百度云和天翼云上...

wangxuwei ⋅ 今天 ⋅ 0

PHP语言系统ZBLOG或许无法重现月光博客的闪耀历史[图]

最近在写博客,希望通过自己努力打造一个优秀的教育类主题博客,名动江湖,但是问题来了,现在写博客还有前途吗?面对强大的自媒体站点围剿,还有信心和可能型吗? 至于程序部分,我选择了P...

原创小博客 ⋅ 今天 ⋅ 0

IntelliJ IDEA 2018.1新特性

工欲善其事必先利其器,如果有一款IDE可以让你更高效地专注于开发以及源码阅读,为什么不试一试? 本文转载自:netty技术内幕 3月27日,jetbrains正式发布期待已久的IntelliJ IDEA 2018.1,再...

Romane ⋅ 今天 ⋅ 0

浅谈设计模式之工厂模式

工厂模式(Factory Pattern)是 Java 中最常用的设计模式之一。这种类型的设计模式属于创建型模式,它提供了一种创建对象的最佳方式。 在工厂模式中,我们在创建对象时不会对客户端暴露创建逻...

佛系程序猿灬 ⋅ 今天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部