文档章节

Python数据分析班升级版

wusejason
 wusejason
发布于 2017/08/14 15:31
字数 1516
阅读 45
收藏 1
点赞 0
评论 0

http://www.chinahadoop.cn/classroom/39/introduction

主讲老师: 梁斌 资深算法工程师 查尔斯特大学(Charles Sturt University)计算机博士,从事机器学习、计算机视觉及模式识别等相关方向的研究,在计算机视觉等国际会议及期刊发表10余篇学术论文。现就职于澳大利亚某科学研究机构,负责算法改进及其产品化、数据分析处理及可视化。

课程简介: 近两年来,数据分析师的岗位需求非常大,90%的岗位技能需要掌握Python作为数据分析工具,Python语言的易学性、快速开发,拥有丰富强大的扩展库和成熟的框架等特性很好地满足了数据分析师的职业技能要求。 本课程以案例驱动的方式讲解如何利用Python完成数据获取、处理、数据分析及可视化方面常用的数据分析方法与技巧。每章节中都会引入Kaggle或工业项目数据集,通过这些实际案例让学员轻松掌握使用Python分析来自不同领域的数据,随课代码及案例代码均会提供给学员自行实操。

升级内容: 据IDC的调查报告显示:企业中的大部分数据都是非结构化数据,这些数据每年都按指数增长60%。因此,本期升级课程在《Python数据分析》第一期的基础上,主要新增了非结构化数据分析以及常用的分析建模方法,从而帮助学员及时更新并掌握最新的数据分析知识。 具体新增内容如下:

  1. 使用最新版本的Python 3.x作为分析工具

  2. 新增数据分析常用的建模知识

  3. 新增使用Python处理和分析时间序列数据

  4. 新增使用Python进行文本数据分析

  5. 新增使用Python进行图像数据处理及分析

  6. 升级全部随课项目,并提供更详细的分析步骤 面向人群:

  7. 想了解和学习典型的数据分析流程和实践方法的学习者

  8. 想接触和学习非结构化数据(比如:文本、图像等)分析的学习者

  9. 想学习数据分析中常用建模知识的相关从业人员

  10. 尚不会使用Python的数据分析师从业者

  11. 想转行从事数据分析师行业的学习者

  12. 想使用Python实现机器学习的工程师 学习收益: 通过本课程的学习,学员将会收获:

  13. 熟悉数据分析的流程,包括数据采集、处理、可视化等

  14. 掌握Python语言作为数据分析工具,从而有能力驾驭不同领域数据分析实践

  15. 掌握非结构化数据的处理与分析

  16. 快速积累多个业务领域的数据分析项目经验

  17. 掌握使用Python实现基于机器学习的数据分析和预测

  18. 掌握数据分析中常用的建模知识 开课时间: 2017年2月18日

学习方式: 在线直播,共9次课,每次2小时 每周2次(周六、日,下午15:00 - 17:00) 直播后提供录制回放视频,可在线反复观看,有效期1年

课程大纲: 第一课 工作环境准备及数据分析建模理论基础 (2课时)

  1. 课程介绍

  2. Python语言基础及Python 3.x新特性

  3. 使用NumPy和SciPy进行科学计算

  4. 数据分析建模理论基础 a. 数据分析建模过程 b. 常用的数据分析建模工具

  5. 实战案例:科技工作者心理健康数据分析(Mental Health in Tech Survey) 第二课 数据采集与操作 (2课时)

  6. 本地数据的采集与操作 a. 常用格式的本地数据读写 b. Python的数据库基本操作

  7. 网络数据的获取与表示 a. BeautifulSoup解析网页 b. 爬虫框架Scrapy基础

  8. 回归分析-- Logistic回归

  9. 实战案例:获取国内城市空气质量指数数据 第三课 数据分析工具Pandas (2-3课时)

  10. Pandas的数据结构

  11. Pandas的数据操作 a. 数据的导入、导出 b. 数据的过滤筛选 c. 索引及多重索引

  12. Pandas统计计算和描述

  13. 数据的分组与聚合

  14. 数据清洗、合并、转化和重构

  15. 聚类模型 -- K-Means

  16. 实战案例:全球食品数据分析(World Food Facts) 第四课 数据可视化 (2课时)

  17. Matplotlib绘图

  18. Pandas绘图

  19. Seaborn绘图

  20. 交互式数据可视化 -- Bokeh绘图

  21. 实战案例:世界高峰数据可视化 (World's Highest Mountains) 第五课 时间序列数据分析 (2课时)

  22. Python的日期和时间处理及操作

  23. Pandas的时间序列数据处理及操作

  24. 时间数据重采样

  25. 时间序列数据统计 -- 滑动窗口

  26. 时序模型 -- ARIMA

  27. 实战案例:股票数据分析 第六课 文本数据分析 (2课时)

  28. Python文本分析工具NLTK

  29. 分词

  30. 情感分析

  31. 文本分类

  32. 分类与预测模型 -- 朴素贝叶斯

  33. 实战案例:微博情感分析 第七课 图像数据处理及分析 (2课时)

  34. 基本的图像操作和处理

  35. 常用的图像特征描述

  36. 分类与预测模型 -- 人工神经网络

  37. 实战案例:电影口碑与海报图像的相关性分析 第八课 机器学习基础及机器学习库scikit-learn (2课时)

  38. 机器学习基础

  39. Python机器学习库scikit-learn

  40. 特征降维 -- 主成分分析

  41. 实战案例:识别Twitter用户性别 (Twitter User Gender Classification) 第九课 项目实战:通过移动设备行为数据预测使用者的性别和年龄(2课时)

  42. 交叉验证及参数调整

  43. 特征选择

  44. 项目实操

  45. 课程总结 =========== 获取教程请到吾爱程序猿官网:http://www.52programer.com/

© 著作权归作者所有

共有 人打赏支持
wusejason
粉丝 4
博文 51
码字总数 59207
作品 0
深圳
程序员
分享一些关于数据分析的学习资料

时间过得真快,转眼一周又要过去了。这一周里你读了什么书?学到了什么知识?有什么收获? 这周里,我收集到一些关于Python数据分析的学习资料,在这里一并分享给大家: Python数据分析班升级...

爱吃西瓜的番茄酱 ⋅ 05/13 ⋅ 0

jupyter notebook的安装与使用

概要 jupyter notebook是一个python交互式编辑器,是一个运行在wen上的运行程序,允许创建和共享包含实时代码,方程,可视化和说明文档。(简明一点就是ipython的升级版) 主要用途 更多的用途...

徐代龙 ⋅ 04/30 ⋅ 0

连 00 后学 Python 了,身为程序员的我慌了

2018 年 1 月 16 日,教育部召开新闻发布会,正式将人工智能、物联网、大数据处理划入高中新课标,并于今年秋季开始执行。这意味着,现在 16 岁的学生就要开始学习编程了! 本次核心目标:修...

dqcfkyqdxym3f8rb0 ⋅ 05/06 ⋅ 0

Python 调用 matplotlib 实现交互式数据可视化图表案例

交互式的数据可视化图表是 New IT 新技术的一个应用方向,在过去,用户要在网页上查看数据,基本的实现方式就是在页面上显示一个表格出来,的而且确,用表格的方式来展示数据,显示的数据量会...

xjtuhit ⋅ 06/11 ⋅ 0

我用 Python 爬取微信好友,最后发现一个大秘密

前言 你身处的环境是什么样,你就会成为什么样的人。现在人们日常生活基本上离不开微信,但微信不单单是一个即时通讯软件,微信更像是虚拟的现实世界。你所处的朋友圈是怎么样,慢慢你的思想...

j2iayu7y ⋅ 05/08 ⋅ 0

从零开始用Python3做数据分析

点击关注 异步图书,置顶公众号 每天与你分享 IT好书 技术干货 职场知识 参与文末话题讨论,每日赠送异步图书 ——异步小编 欢迎来到Python数据分析的世界!如今,Python已成为数据分析和数据...

异步社区 ⋅ 05/19 ⋅ 0

荐书丨确认过眼神,这份Python书单一定是你的菜

点击上方“程序人生”,选择“置顶公众号” 第一时间关注程序猿(媛)身边的故事 Python 是军刀型的开源工具,被广泛应用于Web 开发、爬虫、数据清洗、自然语言处理、机器学习和人工智能等方...

csdnsevenn ⋅ 05/05 ⋅ 0

大数据分析挖掘学习方向?数据分析师的就业前景怎么样?

加米谷数据分析挖掘课程明细,从理论到云端实操环境到项目实战,手把手教您从0掌握数据分析与挖掘技术,带您走进数据时代。 第一阶段(python基础) python入门:1、Python版本特性介绍2、P...

加米谷大数据 ⋅ 04/17 ⋅ 0

Python程序员专栏欢迎您的投稿

1、关于投稿 关注我们Python程序员知乎专栏:https://zhuanlan.zhihu.com/pythoncxy 的小伙伴已经快2w人啦,很感谢大家对我们的支持!我们专栏现在欢迎各位写Python文章的作者投稿,只要你玩...

Python爱好者社区 ⋅ 06/12 ⋅ 0

Python发展迅速,成为学术界新主流

如果说2018年以前R是数据学术界的主流,但是现在Python正在慢慢取代R在学术界的地位。 Python与R相比速度要快。Python可以直接处理上G的数据;R不行,R分析数据时需要先通过数据库把大数据转...

Python燕大侠 ⋅ 05/07 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

vbs 取文件大小 字节

dim namedim fs, s'name = Inputbox("姓名")'msgbox(name)set fs = wscript.createobject("scripting.filesystemobject") 'fs为FSO实例if (fs.folderexists("c:\temp"))......

vga ⋅ 11分钟前 ⋅ 1

高并发之Nginx的限流

首先Nginx的版本号有要求,最低为1.11.5 如果低于这个版本,在Nginx的配置中 upstream web_app { server 到达Ip1:端口 max_conns=10; server 到达Ip2:端口 max_conns=10; } server { listen ...

算法之名 ⋅ 今天 ⋅ 0

Spring | IOC AOP 注解 简单使用

写在前面的话 很久没更新笔记了,有人会抱怨:小冯啊,你是不是在偷懒啊,没有学习了。老哥,真的冤枉:我觉得我自己很菜,还在努力学习呢,正在学习Vue.js做管理系统呢。即便这样,我还是不...

Wenyi_Feng ⋅ 今天 ⋅ 0

博客迁移到 https://www.jianshu.com/u/aa501451a235

博客迁移到 https://www.jianshu.com/u/aa501451a235 本博客不再更新

为为02 ⋅ 今天 ⋅ 0

win10怎么彻底关闭自动更新

win10自带的更新每天都很多,每一次下载都要占用大量网络,而且安装要等得时间也蛮久的。 工具/原料 Win10 方法/步骤 单击左下角开始菜单点击设置图标进入设置界面 在设置窗口中输入“服务”...

阿K1225 ⋅ 今天 ⋅ 0

Elasticsearch 6.3.0 SQL功能使用案例分享

The best elasticsearch highlevel java rest api-----bboss Elasticsearch 6.3.0 官方新推出的SQL检索插件非常不错,本文一个实际案例来介绍其使用方法。 1.代码中的sql检索 @Testpu...

bboss ⋅ 今天 ⋅ 0

informix数据库在linux中的安装以及用java/c/c++访问

一、安装前准备 安装JDK(略) 到IBM官网上下载informix软件:iif.12.10.FC9DE.linux-x86_64.tar放在某个大家都可以访问的目录比如:/mypkg,并解压到该目录下。 我也放到了百度云和天翼云上...

wangxuwei ⋅ 今天 ⋅ 0

PHP语言系统ZBLOG或许无法重现月光博客的闪耀历史[图]

最近在写博客,希望通过自己努力打造一个优秀的教育类主题博客,名动江湖,但是问题来了,现在写博客还有前途吗?面对强大的自媒体站点围剿,还有信心和可能型吗? 至于程序部分,我选择了P...

原创小博客 ⋅ 今天 ⋅ 0

IntelliJ IDEA 2018.1新特性

工欲善其事必先利其器,如果有一款IDE可以让你更高效地专注于开发以及源码阅读,为什么不试一试? 本文转载自:netty技术内幕 3月27日,jetbrains正式发布期待已久的IntelliJ IDEA 2018.1,再...

Romane ⋅ 今天 ⋅ 0

浅谈设计模式之工厂模式

工厂模式(Factory Pattern)是 Java 中最常用的设计模式之一。这种类型的设计模式属于创建型模式,它提供了一种创建对象的最佳方式。 在工厂模式中,我们在创建对象时不会对客户端暴露创建逻...

佛系程序猿灬 ⋅ 今天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部