文档章节

资源总结——七步学习数据挖掘与数据科学

 爱哭的小魔女
发布于 2017/07/17 15:36
字数 1427
阅读 3
收藏 0

原文链接

摘要: 本文概述了学习数据挖掘与数据科学的七个步骤,每一步都给出了详细的学习资源,便于初学者.照指南开展数据挖掘与数据科学的学习。

首发地址:https://yq.aliyun.com/articles/68449

 

想知道如何学习数据挖掘和数据科学吗?本文概述了七个步骤,指出的资源能让你成为一名数据科学家。

作者为Gregory Piatetsky,是一名数据挖掘与数据科学方面的专家。

208d17688bcff0df08dbd8d6fab25db9d0cf32bf

以下为7个步骤用于学习数据挖掘和数据科学。虽然有编号顺序,你也可以并行或以不同的顺序学习:

1 语音:学习R、Python以及SQL语音;

2 工具:了解如何使用数据挖掘和可视化工具;

3 教材:阅读介绍性的教科书,了解基础知识;

4 教育:观看网络研讨会,参加课程,考虑获得数据科学中的证书或学位;

5 数据:检查可用的数据资源并在那里找到东西;

6 竞赛:参加数据挖掘竞赛;

7 通过社交网络,团体和会议与其他数据科学家交流;

另外,不要忘记订阅KDnuggets新闻邮件,并跟随@kdnuggets了解关于分析、大数据、数据挖掘和数据科学的最新消息。

交互使用数据挖掘与数据科学——见我的分析行业概览报告,报告中有关于相关术语的演变和普及,比如统计、知识发现、数据挖掘、预测分析、数据科学以及大数据。

 1 学习语言

民意调查表明,数据挖掘最流行的语言是R,python和SQL语言。

这里有很多的资源,比如:

免费电子书资源关于R语音的数据科学

Python数据科学入门

Python数据分析:现实世界数据的灵活工具;

不可或缺的Python:数据源到数据科学

W3学校学习SQL

工具:数据挖掘,数据科学和可视化软件

许多的数据挖掘工具应用于不同的任务,但最好是使用支持数据分析的整个过程的数据挖掘套件。

你可以使用开源(免费)的工具,如启动KNIMERapidMinerWeka

然而,对于许多分析工作还需要知道SAS,它是全球领先的商业工具并得到广泛应用。

其他受欢迎的分析和数据挖掘软件包括MATLAB、StatSoft推出STATISTICA,Microsoft SQL Server、IBM SPSS Modeler以及Rattle。

可视化是任何数据分析的重要组成部分——学习如何使用Microsoft Excel,R graphics,以及Tableau 。其它好的可视化工具包括TIBCO Spotfire和Miner3D。

3教材

网络上有很多的数据挖掘和数据科学教材,但你可以参考以下这些:

数据挖掘与分析:基本概念与算法

数据挖掘:机器学习工具实践与方法

统计学习、数据挖掘以及预测的要素

LION书籍:学习与智能优化

大数据集挖掘

StatSoft推出的电子统计教材

教育:网络研讨会、课程、证书以及学位

可以通过观看一些许多免费的关于数据分析、大数据,数据挖掘和数据科学的网络研讨会和网络直播开始学习。

也有许多短期和长期的在线课程,其中许多是免费的-见KDnuggets在线教育目录

特别参考以下课程:

 机器学习

 从数据中学习

 开放式在线学习应用数据科学

 使用Weka进行数据挖掘

 本文作者的数据挖掘课程

最后,考虑获得关于数据挖掘和数据科学的证书或高级学位,如MS-见KDnuggets关于分析、数据挖掘和数据科学教育的目录

数据

你需要数据进行分析-见KDnuggets关于数据挖掘的目录,包含:

 政府、联邦、州、城市、本地和公共数据站点和门户

 数据API、集线器、商场、平台、门户和搜索引擎

 免费公共数据集

竞争

再一次强调,最好是边学边做,所以在学习的同时也可以参加Kaggle竞赛 -从初学者竞赛开始,比如使用机器学习预测泰坦尼克号生存

交流:会议、团体和社交网络

你可以加入许多同类团体-见关于分析、大数据,数据挖掘以及数据科学前30的 LinkedIn组织

AnalyticBridge是一个分析和数据科学活跃的社区。

你也可以参加一些关于分析、大数据、数据挖掘、数据科学与知识发现的会议和研讨会

此外,考虑加入ACM SIGKDD,它会举办一年一度的KDD大会——该领域领先的研究会议。

……

还可以参考其它的回.:

如何开始学习数据科学

关于数据科学的使用简介

通过Metromap课程成为一名数据科学家

获取免费数据科学教育

 

 本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

 

文章原标题《7 Steps for Learning Data Mining and Data Science》,作者:Gregory Piatetsky,译者:海棠

文章为简译,更为详细的内容,请查看原文

本文由用户为个人学习及研究之目的自行翻译发表,如发现侵犯原作者的版权,请与社区联系处理yqgroup@service.aliyun.com

http://img.blog.csdn.net/20170717141256716?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWlrdWRlbW4=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

原文链接

本文转载自:

粉丝 0
博文 105
码字总数 7329
作品 0
私信 提问
七本书籍带你打下机器学习和数据科学的数学基础

大多数人学习数据科学的重心放在编程上面,然而,要真正精通数据科学的话是不能够忽视数据科学背后的数据基础。本篇文章,将分享给读者我喜欢的七本有关于数据科学基础的书,下面将逐一为大家...

【方向】
2018/04/20
0
0
七步教你Python进行机器学习

网络上有很多Python学习资源和机器学习学习资源,对于一个新手而言,如何开始呢?本篇文章将教你七步学会使用Python进行机器学习。 万事开头难。面对纷繁万千的网络学习资源,不知如何下手,...

断桥残雪断桥残雪
2015/11/20
4.1K
0
Python数据科学|第一章:数据科学家的武器库

本系列教程为《Python数据科学——技术详解与商业实践》的读书笔记。该书以Python为实现工具,以商业实战为导向,从技术、业务、商业实战3个维度来展开学习。本书共19章(Python环境安装和P...

罗罗攀
2018/07/30
0
0
数据分析师的基本素养——论如何成为一名数据科学家 Part 2

更多深度文章,请关注: https://yq.aliyun.com/cloud 本文为《数据分析师的基本素养——论如何成为一名数据科学家》文章的第二部分,第一部分请点击这里。 Pronojit Saha,数据发烧友 数据科...

【方向】
2017/02/17
0
0
手把手教你用Kaggle开启机器学习之旅

我经常被朋友和大学生问到“如何入门机器学习或数据科学”。 所以,这是我的答案…… 前言 早些时候,我不太确定。我会说类似“学这门课”或“读这本教程”或“先学Python(这是我做过的事情...

技术小能手
2018/11/16
0
0

没有更多内容

加载失败,请刷新页面

加载更多

mysql概览

学习知识,首先要有一个总体的认识。以下为mysql概览 1-架构图 2-Detail csdn |简书 | 头条 | SegmentFault 思否 | 掘金 | 开源中国 |

程序员深夜写bug
53分钟前
4
0
golang微服务框架go-micro 入门笔记2.2 micro工具之微应用利器micro web

micro web micro 功能非常强大,本文将详细阐述micro web 命令行的功能 阅读本文前你可能需要进行如下知识储备 golang分布式微服务框架go-micro 入门笔记1:搭建go-micro环境, golang微服务框架...

非正式解决方案
今天
4
0
前端——使用base64编码在页面嵌入图片

因为页面中插入一个图片都要写明图片的路径——相对路径或者绝对路径。而除了具体的网站图片的图片地址,如果是在自己电脑文件夹里的图片,当我们的HTML文件在别人电脑上打开的时候图片则由于...

被毒打的程序猿
今天
3
0
Flutter 系列之Dart语言概述

Dart语言与其他语言究竟有什么不同呢?在已有的编程语言经验的基础上,我们该如何快速上手呢?本篇文章从编程语言中最重要的组成部分,也就是基础语法与类型变量出发,一起来学习Dart吧 一、...

過愙
今天
3
0
rime设置为默认简体

转载 https://github.com/ModerRAS/ModerRAS.github.io/blob/master/_posts/2018-11-07-rime%E8%AE%BE%E7%BD%AE%E4%B8%BA%E9%BB%98%E8%AE%A4%E7%AE%80%E4%BD%93.md 写在开始 我的Arch Linux上......

zhenruyan
今天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部