文档章节

大数据需要学什么

董黎明
 董黎明
发布于 10/12 14:39
字数 1375
阅读 13
收藏 0

学习要根据自身情况来定,如果你是零基础,那就必须先从基础Java开始学起(大数据支持很多开发语言,但企业用的最多的还是JAVA),接下来学习数据结构、Linux系统操作、关系型数据库,夯实基础之后,再进入大数据的学习,具体可以按照如下体系:

第一阶段

CORE JAVA (加**的需重点熟练掌握,其他掌握)

Java基础**

数据类型,运算符、循环,算法,顺序结构程序设计,程序结构,数组及多维数组

面向对象**

构造方法、控制符、封装

继承**

多态**

抽象类、接口**

常用类

集合Collection、list**

HashSet、TreeSet、Collection

集合类Map**

异常,File

文件/流**

数据流和对象流**

线程(理解即可)

网络通信(理解即可)

第二阶段

数据结构

关系型数据库

Linux系统操作

Linux操作系统概述,安装Linux操作系统,图形界面操作基础,Linux字符界面基础,字符界面操作进阶,用户、组群和权限管理,文件系统管理,软件包管理与系统备份,Linux网络配置                 (主要掌握Linux操作系统的理论基础和服务器配置实践知识,同时通过大量实验,着重培养动手能力。了解Linux操作系统在行业中的重要地位和广泛的使用范围。在学习Linux的基础上,加深对服务器操作系统的认识和实践配置能力。加深对计算机网络基础知识的理解,并在实践中加以应用。掌握Linux操作系统的安装、命令行操作、用户管理、磁盘管理、文件系统管理、软件包管理、进程管理、系统监测和系统故障排除。掌握Linux操作系统的网络配置、DNS、DHCP、HTTP、FTP、SMTP和POP3服务的配置与管理。为更深一步学习其它网络操作系统和软件系统开发奠定坚实的基础。与此同时,如果大家有时间把javaweb及框架学习一番,会让你的大数据学习更自由一些)

重点掌握:

常见算法

数据库表设计,SQL语句,Linux常见命令

第三阶段

Hadoop阶段

离线分析阶段

实时计算阶段

重点掌握:

Hadoop基础,HDFS,MapReduce,分布式集群,Hive,Hbase,Sqoop

,Pig,Storm实时数据处理平台,Spark平台

以上就是笔者总结学习阶段,如果还想了解更多的知识,在这里还是要推荐下我自己建的大数据学习群:199427210,群里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有大数据软件开发相关的),包括我自己整理的一份2018最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深入大数据的小伙伴加入。建议每个想要学习大数据的人,按照这个学习阶段循序渐进,不断完善自己的知识架构,提升自身的理论知识,然后找一个合适的项目,跟着团队去做项目,积累自己的经验,相信会在大数据的舞台上展现出很好的发展。

 

大数据的 路线图

 

大数据开发学习可以按照以下内容进行学习:

第一阶段:JavaSE+MySql+Linux

学习内容:Java 语言入门 → OOP 编程 → Java 常用Api、集合 → IO/NIO → Java 实

用技术 → Mysql 数据库 → 阶段项目实战 → Linux 基础 → shell 编程

学习目标:学习java语言,掌握java程序编写、面向对象程序开发,掌握MySql体系结构及核心编程技术,打好 Linux 基础,为后续学习提供良好的语言基础。

第二阶段:Hadoop 与生态系统

学习内容:Hadoop → MapReduce → Avro → Hive → HBase → Zookeeper →Flume → Kafka → Sqoop → Pig

学习目标:掌握大数据学习基石Hadoop、数据串行化系统与技术、数据的统计分析、分布式集群、流行的队列、数据迁移、大数据平台分析等

第三阶段:Storm 与Spark 及其生态圈

学习内容:Storm → Scala → Spark → Spark SQL → Spark Streaming →Spark 机器学习

学习目标:让大家拥有完整项目开发思路和架构设计,掌握从数据采集到实时计算到数据存储再到前台展示,所有工作一个人搞定!并可以从架构的层次站在架构师的角度去完成一个项目。

第四阶段:其他

学习内容:Mahout 机器学习→ R 语言→Python

学习目标:机器学习领域经典算法的实现,熟练使用 R语法和统计思维,可以基于具体问题建立数学模型,掌握python技术与数据分析,将数据结果以可视化的直观方式展示给目标用户。

第五阶段:项目实战、技术综合运用

 

© 著作权归作者所有

共有 人打赏支持
董黎明
粉丝 17
博文 127
码字总数 304081
作品 0
深圳
私信 提问
一位转行成功并从事5年的大数据的经验分享

本人30岁,从学大数据到现在有6年的时间,我谈一下我的经验分享 我自己的经历:刚开始大数据是看书,一页页的看书,因为身边有一个好的资源,有问题可以问我朋友,后来发现看大数据的零基础书...

JAVA丶学习
04/01
0
0
如何学习大数据 学大数据有技巧吗

先在的大数据技术人员备受各大企业及用人单位的青睐,因此参加大数据培训学习大数据的人员也在不断的增加,但是关于学习大数据的技巧很 多人不是很清楚,纷纷询问如何才能快速的学好大数据,...

董黎明
09/15
0
0
机器学习/深度学习书单推荐及学习方法

所谓的“大数据”在近两年来极其火爆,甚至连街头巷尾的买菜大妈都知道。大数据最根本的基础是机器学习/深度学习,然而很多程序员们想要从事数据岗位的工作却不知如何下手。 数学需要吗?需要...

valada
04/12
0
0
从小白到大数据技术专家的学习历程

最近有很多人问我,大数据是怎么学?需要学什么技术以及这些技术的学习顺序是什么?今天有时间我把个问题总结成文章分享给大家。 ·大数据处理技术怎么学习呢?首先我们要学习Java语言和Lin...

qq_41842569
04/18
0
0
大一学生提问大数据和云计算的问题

我是一个大一的学生,是计算机科学与技术系的计算机科学与技术专业。老师们说我们是大数据和云计算方向的,但是半年过去了,老师也就上了很少的几节专业导引课,然后在网上也没弄明白我们专业...

龙瑀璇
2015/02/25
1K
16

没有更多内容

加载失败,请刷新页面

加载更多

python机器学习及实践学习笔记1-如何打开ipynb后缀文件

python机器学习及实践学习笔记1-如何打开ipynb后缀文件 2017年02月22日 14:58:08 hustzhoutian 阅读数:45365更多 个人分类: 深度学习 需要安装ipython notebook,如果你已经安装Anaconda软...

linjin200
6分钟前
1
0
关于在vim中的查找和替换

1,查找 在normal模式下按下/即可进入查找模式,输入要查找的字符串并按下回车。 Vim会跳转到第一个匹配。按下n查找下一个,按下N查找上一个。 Vim查找支持正则表达式,例如/vim$匹配行尾的"...

休辞醉倒
11分钟前
0
0
in_array的坑

PHP in_array的坑 ps: 应该是弱类型语言的坑 php文档 顾名思义,in_array就是查找一个值是否在数组里面。 问题 事故现场 一个sql注入的测试代码如下: $type = $_GET['type'];$types = [2,3,...

o0无忧亦无怖
11分钟前
14
1
Yarn(包管理器) 的基本用法

Yarn是一个快速、可靠、安全的依赖管理工具,是npm的代替品。 Yarn对你的代码来说是一个包管理工具,你可以通过它使用全世界开发者的代码,或者分享自己的代码。 安装Yarn: 操作系统不同,安...

帝子兮
12分钟前
1
0
阿里云HBase全新发布X-Pack NoSQL数据库再上新台阶

一、八年双十一,造就国内最大最专业HBase技术团队 阿里巴巴集团早在2010开始研究并把HBase投入生产环境使用,从最初的淘宝历史交易记录,到蚂蚁安全风控数据存储。持续8年的投入,历经8年双...

阿里云官方博客
12分钟前
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部