文档章节

一个新手如何系统的学习数据分析

孤独一刀
 孤独一刀
发布于 2017/02/13 22:38
字数 561
阅读 24
收藏 4

一个新手如何系统的学习数据分析
下面我先给出书单:

1.Numpy:
  Numpy是python科学计算的基础包,它提供以下功能(不限于此):
    (1)快速高效的多维数组对象naarray 
    (2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数
    (3)用于读写硬盘上基于数组的数据集的工具
    (4)线性代数运算、傅里叶变换,以及随机数生成
    (5)用于将C、C++、Fortran代码集成到python的工具

2.pandas
  pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数。pandas兼具Numpy高性能的数组计算功能以及电子表格和关系型数据(如SQL)灵活的数据处理能力。它提供了复杂精细的索引功能,以便更为便捷地完成重塑、切片和切块、聚合以及选取数据子集等操作。
  对于金融行业的用户,pandas提供了大量适用于金融数据的高性能时间序列功能和工具。
  DataFrame是pandas的一个对象,它是一个面向列的二维表结构,且含有行标和列标。
  ps.引用一段网上的话说明DataFrame的强大之处:
  Excel 2007及其以后的版本的最大行数是1048576,最大列数是16384,超过这个规模的数据Excel就会弹出个框框“此文本包含多行文本,无法放置在一个工作表中”。Pandas处理上千万的数据是易如反掌的事情,同时随后我们也将看到它比SQL有更强的表达能力,可以做很多复杂的操作,要写的code也更少。 说了一大堆它的好处,要实际感触还得动手码代码。

3.matplotlib
  matplotlib是最流行的用于绘制数据图表的python库。

4.Scipy
  Scipy是一组专门解决科学计算中各种标准问题域的包的集合。
5.statsmodels: 各种模型  ****待学习
6.scikit-learn: machine learning模块,很全 ****待学习

 

转载于:http://www.cnblogs.com/zzhzhao/p/5269217.html

本文转载自:

共有 人打赏支持
孤独一刀
粉丝 1
博文 13
码字总数 1060
作品 0
西安
python-37: 模拟登录

我们通过前面的两个实例讲解了爬虫的简单应用,但是在很多网站中,你将会发现你写的所有代码都没有用 因为你没有登录 登录网站是一种很常见的行为,就拿百度贴吧来说,你需要先登录才能发贴回...

达岭凹老大
2015/12/01
148
0
机器学习之学习路线

# 机器学习教程 ## 生产案例 Scikit-Learn机器学习实践——垃圾短信识别 ## 引用 http://blog.51cto.com/6230973/1983254 机器学习入门 - 1. 介绍与决策树(decision tree) http://summertime...

heavenseahill
2017/10/13
0
0
【书单】18本数据科学家必读的R语言和Python相关书籍

原文来自 Analytics Vidhya 编译 CDA 编译团队 本文为 CDA 数据分析师原创作品,转载需授权 前言 “这就是阅读。即将新软件安装到大脑里的过程。” 就我个人而言,我从视频和在线教程中所学到...

Data Analyst
2017/06/01
0
0
如何编写更好的SQL查询:终极指南-第一部分

结构化查询语言(SQL)是数据挖掘分析行业不可或缺的一项技能,总的来说,学习这个技能是比较容易的。对于SQL来说,编写查询语句只是第一步,确保查询语句高效并且适合于你的数据库操作工作,...

powertoolsteam
2017/08/29
0
0
这10本由浅入深的好书,或让你成为机器学习领域的专家

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。 以下为译文: 机器学习是个跨领域的学科,而且在实际应用中有巨大作用,但是没有一本书能让你成为机器学习的专家。 在这篇文章...

【方向】
2016/12/13
0
0

没有更多内容

加载失败,请刷新页面

加载更多

python中cv2模块imread函数

导入 >> import cv2>> import numpy as np 读图片 >> image_arr = cv2.imread('file_path') 灰度图扩展成彩色图 可以通过图片的channel判断是否是灰度图。如果需要可以将灰度图扩展到RGB......

温子寒
21分钟前
1
0
利用剪切板JS API优化输入框的粘贴体验

直接复制记录下 /**@description 表单输入框粘贴体验优化,出处https://www.zhangxinxu.com/wordpress/?p=8003@author zhangxinxu*/// 遍历所有的输入框[].slice.call(document.qu...

红羊在厦门
28分钟前
2
0
2018CTF大赛学习

1.C伪随机数,可预测,可用来做加密解密,如 int main() { // This program will create same sequence of // random numbers on every program run for(int i = 0; ......

simpower
42分钟前
1
0
XamarinEssentials教程移除键值首选项的键值

XamarinEssentials教程移除键值首选项的键值 如果开发者不再使用首选项中的某一项时,可以将该项移除掉。此时可以使用Preferences类的Remove()方法,该方法可以将存在于首选项中的指定键以及...

大学霸
49分钟前
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部