文档章节

数据挖掘的学习资源

城固如春
 城固如春
发布于 2017/03/22 22:34
字数 742
阅读 37
收藏 0

数据挖掘(Data Mining)作为一个领域,比机器学习要大,偏应用。互联网公司也大量使用数据挖掘技术,作为即将毕业进入互联网公司从事机器学习算法开发的我,最近计划系统了解一下这方面的理论和技术。作为一个习惯,学习一个东西之前总要上网找找学习资源(网站,书籍,学术期刊会议),以保证学到的是最前沿最系统的知识,并以最高效率学习。

希望这些资源能够最终帮助自己了解这些酷炫的问题:搜索引擎是怎样工作的(为什么谷歌搜索的结果总是比百度好)?数据挖掘/机器学习在互联网公司的典型应用(例如社交网络上的大量信息腾讯和Facebook是怎么使用的以产生商业价值)?各种问答机器人的原理(如小度机器人/度秘,京东智能机器人)?

 

wikipedia.org,历史,领域概述,资源链接:

Data mining:介绍了数据挖掘的概念、过程、学术会议、软件等,右侧有细分条目;

Category:Data mining:更多和数据挖掘有关的条目;

DMOZ关于DM:资源链接;

谷歌上不了推荐镜像站,搜索和下载电子书籍推荐Library Genesis更多在线图书馆)。

 

大学课程、在线教程

Stanford课程:CS246 Mining Massive Data SetsCS246H Mining Massive Data Sets: Hadoop LabsCS341 Project in Mining Massive Data Sets,配套书籍 Mining of Massive DatasetsDataMiningTalk

CMU课程:Data Mining: Spring 2013Statistics 36-350: Data Mining (fall 2009)

南京大学课程:Introduction to Data Mining

Coursera:Data Mining Specialization

 

专著、书籍

Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeff Ullman, 2015; PPT;中文译本:大数据-互联网大规模数据挖掘与分布式处理;

Data Mining: The Textbook, Charu C. Aggarwal, 2015; 资源链接;

Data Mining: Concepts and Techniques (3rd ed.), Jiawei Han, Micheline Kamber, Jian Pei, 2011; PPT;中文译本:数据挖掘:概念与技术;

Data Mining and Analysis: Fundamental Concepts and Algorithms, Mohammed J. Zaki, Wagner Meira Jr, 2014; 作者网站;

Introduction to Data Mining, Pang-Ning Tan, Michael Steinbach, Vipin Kumar, 2006; PPT;中文译本:数据挖掘导论;

A Practical Guide to Data Mining for Business and Industry, Andrea Ahlemeyer-Stubbe, Shirley Coleman, 2014; PPT;

Data Mining: Practical Machine Learning Tools and Techniques (3rd ed.), Ian H. Witten, Eibe Frank, Mark A. Hall, 2011; PPT;中文译本:数据挖掘:实用机器学习工具与技术;

Programming Collective Intelligence: Building Smart Web 2.0 Applications, Toby Segaran, 2007; 中文译本:集体智慧编程。

 

学术论文

顶级会议:KDDICDE

更多会议期刊见:Google Scholar DMMicrosoft academic DMKDnuggets DM Conferences

 

学习网站

KDnuggets:各种资源,博文,课程、软件、Datasets等链接;

国内的两个网站:我爱机器学习机器学习日报

Data Sets:UCI Machine Learning RepositoryPublic datasets for machine learning

Competitions:KaggleDMCKnowledge PitTunedITDrivenData

这里也整理了一些资源,这里整理了数据挖掘博客。

 

程序、库

R语言RDataMininginside-R

HadoopTutorialHadoop at Yahoo

本文转载自:http://www.cnblogs.com/Leo_wl/p/4928924.html

城固如春
粉丝 12
博文 187
码字总数 25379
作品 0
杭州
程序员
私信 提问
机器学习资源积累

转自【资源】机器学习资源积累(积累中…) | 学步园+http://www.xuebuyuan.com/2200605.html Andrew Moore,邓侃在CMU的老板,机器学习和数据挖掘专家,写了很多关于数据挖掘和机器学习的P...

DCX_abc
2017/10/23
0
0
Python电子书找不到下载的地方和什么书籍适合你?

Python学习小白必备书籍以及源码下载、代码求助三大网站 Python小白开发入门必备的3本书籍,除了书籍小U还整理了5个程序员们常用的资源网站。 入门书籍一 《Python for data analysis》 这本...

CoXie的大数据世界
2018/06/05
0
0
零经验转行数据分析,需要做什么准备?

数据分析让我通过数据,以“上帝视角”看世界,这是我选择数据分析行业的主要原因。 本文从以下几点为你梳理转行数据分析的思路, 人人都可以转行数据分析么? 数据分析行业升级路线 转行数据...

邓莎
04/21
0
0
Python学习小白必备书籍以及源码下载、代码求助三大网站

Python小白开发入门必备的3本书籍,除了书籍小U还整理了5个程序员们常用的资源网站。 入门书籍一 《Python for data analysis》 这本书涵盖了ipython notebook、Numpy、Scipy和Pandas包的使用...

柯西带你学编程
2018/05/30
0
0
数据库建模平台和挖掘工具 - TipDM

TipDM数据挖掘建模平台是基于Python引擎、用于数据挖掘建模的开源平台。平台提供数量丰富的数据分析与挖掘建模组件,用户可在没有编程基础的情况下,通过拖拽的方式进行操作,将数据输入输出...

又年
07/09
4.1K
1

没有更多内容

加载失败,请刷新页面

加载更多

Spring Boot 2 实战:使用 Spring Boot Admin 监控你的应用

1. 前言 生产上对 Web 应用 的监控是十分必要的。我们可以近乎实时来对应用的健康、性能等其他指标进行监控来及时应对一些突发情况。避免一些故障的发生。对于 Spring Boot 应用来说我们可以...

码农小胖哥
44分钟前
4
0
ZetCode 教程翻译计划正式启动 | ApacheCN

原文:ZetCode 协议:CC BY-NC-SA 4.0 欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远。 ApacheCN 学习资源 贡献指南 本项目需要校对,欢迎大家提交 Pull Request。 ...

ApacheCN_飞龙
55分钟前
4
0
CSS定位

CSS定位 relative相对定位 absolute绝对定位 fixed和sticky及zIndex relative相对定位 position特性:css position属性用于指定一个元素在文档中的定位方式。top、right、bottom、left属性则...

studywin
今天
6
0
从零基础到拿到网易Java实习offer,我做对了哪些事

作为一个非科班小白,我在读研期间基本是自学Java,从一开始几乎零基础,只有一点点数据结构和Java方面的基础,到最终获得网易游戏的Java实习offer,我大概用了半年左右的时间。本文将会讲到...

Java技术江湖
昨天
5
0
程序性能checklist

程序性能checklist

Moks角木
昨天
7
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部