数据分析有感

原创
2016/03/30 11:59
阅读数 61

重点掌握基础的数据处理和分析方法,培养数据驱动业务的敏感度,有效地将数据分析与业务结合起来,能从产品功能和业务的角度提出有针对性的解决方案 。

 

技能要求:python,主要包含pandas、numpy、scipy、sklearn和matplotlib等

 

专业知识要求:数学分析、统计学、概率论与数理统计

主要分析方法:对比分析、相关分析、回归分析、主成分分析、因子分析、聚类分析、判别分析

主要挖掘算法:逻辑回归、决策树、神经网络、贝叶斯、SVM

数据可视化:seaborn、matplotlib

 

后期计划:

1.将各种分析方法和挖掘算法做成Demo

2.数据获取、清洗处理、数据分析、分析结果导出为Excel或是PDF文档

3.学习流整理

 

 

补充:Statismodels

Statismodels是一个Python包,提供一些互补scipy统计计算的功能,包括描述性统计和统计模型估计和推断。

主要特性

  • 线性回归模型:广义最小二乘法(Generalized least squares),普通最小二乘法(ordinary least squares)
  • glm
  • discrete:离散变量的回归,基于最大似然估计
  • rlm
  • tsa:时间序列分析模型
  • nonparametric
  • datasets
  • stats:常用统计检验
  • iolib:读Stata的.dta格式,输出ascii、latex和html

import statsmodels.api as sm

#!/usr/bin/env python

"""

http://debsoft.blog.163.com/blog/static/17075427220144413712984/

http://www.jb51.net/article/55413.htm

"""

 

 

##显示百分比进度条

import sys

from time import sleep      

def view_bar(i):

    output = sys.stdout

    for count in range(0, i+1):

        second = 0.1

        sleep(second)

        output.write('\rcomplete percent:%.0f%%' % count)

    output.flush()

    

view_bar(100) 

 


 

展开阅读全文
打赏
1
0 收藏
分享
加载中
KYO4321博主

引用来自“OSC大胖森”的评论

matplotlib 好像Matlab 这个词的衍生啊
比较像额,python中的数据可视化功能主要用matplotlib这个库挖哇
2016/04/14 17:34
回复
举报
matplotlib 好像Matlab 这个词的衍生啊
2016/04/12 17:35
回复
举报
KYO4321博主
补充已整理的数据分析挖掘方法相关资料,明确每一阶段的学习目标,每月总结,分析代码整合优化!
2016/04/04 12:58
回复
举报
更多评论
打赏
3 评论
0 收藏
1
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部