文档章节

一个新手如何系统的学习数据分析

孤独一刀
 孤独一刀
发布于 2017/02/13 22:38
字数 561
阅读 29
收藏 4

一个新手如何系统的学习数据分析
下面我先给出书单:

1.Numpy:
  Numpy是python科学计算的基础包,它提供以下功能(不限于此):
    (1)快速高效的多维数组对象naarray 
    (2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数
    (3)用于读写硬盘上基于数组的数据集的工具
    (4)线性代数运算、傅里叶变换,以及随机数生成
    (5)用于将C、C++、Fortran代码集成到python的工具

2.pandas
  pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数。pandas兼具Numpy高性能的数组计算功能以及电子表格和关系型数据(如SQL)灵活的数据处理能力。它提供了复杂精细的索引功能,以便更为便捷地完成重塑、切片和切块、聚合以及选取数据子集等操作。
  对于金融行业的用户,pandas提供了大量适用于金融数据的高性能时间序列功能和工具。
  DataFrame是pandas的一个对象,它是一个面向列的二维表结构,且含有行标和列标。
  ps.引用一段网上的话说明DataFrame的强大之处:
  Excel 2007及其以后的版本的最大行数是1048576,最大列数是16384,超过这个规模的数据Excel就会弹出个框框“此文本包含多行文本,无法放置在一个工作表中”。Pandas处理上千万的数据是易如反掌的事情,同时随后我们也将看到它比SQL有更强的表达能力,可以做很多复杂的操作,要写的code也更少。 说了一大堆它的好处,要实际感触还得动手码代码。

3.matplotlib
  matplotlib是最流行的用于绘制数据图表的python库。

4.Scipy
  Scipy是一组专门解决科学计算中各种标准问题域的包的集合。
5.statsmodels: 各种模型  ****待学习
6.scikit-learn: machine learning模块,很全 ****待学习

 

转载于:http://www.cnblogs.com/zzhzhao/p/5269217.html

本文转载自:

共有 人打赏支持
孤独一刀
粉丝 1
博文 13
码字总数 1060
作品 0
西安
私信 提问
机器学习之学习路线

# 机器学习教程 ## 生产案例 Scikit-Learn机器学习实践——垃圾短信识别 ## 引用 http://blog.51cto.com/6230973/1983254 机器学习入门 - 1. 介绍与决策树(decision tree) http://summertime...

heavenseahill
2017/10/13
0
0
python-37: 模拟登录

我们通过前面的两个实例讲解了爬虫的简单应用,但是在很多网站中,你将会发现你写的所有代码都没有用 因为你没有登录 登录网站是一种很常见的行为,就拿百度贴吧来说,你需要先登录才能发贴回...

达岭凹老大
2015/12/01
148
0
【书单】18本数据科学家必读的R语言和Python相关书籍

原文来自 Analytics Vidhya 编译 CDA 编译团队 本文为 CDA 数据分析师原创作品,转载需授权 前言 “这就是阅读。即将新软件安装到大脑里的过程。” 就我个人而言,我从视频和在线教程中所学到...

Data Analyst
2017/06/01
0
0
如何编写更好的SQL查询:终极指南-第一部分

结构化查询语言(SQL)是数据挖掘分析行业不可或缺的一项技能,总的来说,学习这个技能是比较容易的。对于SQL来说,编写查询语句只是第一步,确保查询语句高效并且适合于你的数据库操作工作,...

powertoolsteam
2017/08/29
0
0
这10本由浅入深的好书,或让你成为机器学习领域的专家

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。 以下为译文: 机器学习是个跨领域的学科,而且在实际应用中有巨大作用,但是没有一本书能让你成为机器学习的专家。 在这篇文章...

【方向】
2016/12/13
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Jmeter参数的AES加密使用

在Jmeter日常实践中,大家应该都遇到过接口传参需要加密的情况。以登陆为例,用户名和密码一般都需要进行加密传输,在服务端再进行解密,这样安全系数会更高,但在使用jmeter进行接口测试的时...

程序猿拿Q
25分钟前
2
0
MYSQL 日期函数 Date and Time Functions

Table 12.13 Date and Time Functions Name Description ADDDATE() Add time values (intervals) to a date value ADDTIME() Add time CONVERT_TZ() Convert from one time zone to another ......

_liucui_
31分钟前
2
0
Android代码混淆ProGuard工作原理简介

ProGuard能够对Java类中的代码进行压缩(Shrink),优化(Optimize),混淆(Obfuscate),预检(Preveirfy)。    1. 压缩(Shrink): 在压缩处理这一步中,用于检测和删除没有使用的类,字段...

SuShine
33分钟前
1
0
Idea 2018激活

教程地址: https://www.52pojie.cn/thread-781394-1-1.html 亲测可用

一个不正经的程序员
39分钟前
1
0
Android组件化开发实践和案例分享

目录介绍 1.为什么要组件化 1.1 为什么要组件化 1.2 现阶段遇到的问题 2.组件化的概念 2.1 什么是组件化 2.2 区分模块化与组件化 2.3 组件化优势好处 2.4 区分组件化和插件化 2.5 applicatio...

潇湘剑雨
40分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部