文档章节

Databook-数据之书

openthings
 openthings
发布于 07/22 11:33
字数 523
阅读 34
收藏 0

Databook-数据之书

用于数据分析的Jupyter Notebooks。

快速创建步骤

  • 创建一个 github.com 账号。
  • 复制本代码仓库到自己的repository,点击fork即可。
  • 打开 https://mybinder.org , 填入上面的github repository地址,点击“launch”开始构建自己的远程服务。
  • 服务网页打开后,将后缀/tree改为/lab,以使用最新的多窗口界面。
  • 添加notebook, 然后运行、修改,shift+enter即可执行cell中的代码。
  • 提交更新到自己的 github repository, 通过运行 ./commit.sh。
  • https://github.com/databooks/databook 拉取更新, 运行 ./upstream-pull.sh.
  • 提交一个 pull-request, 将自己的 notebook 合并到上游 upstream, 需要从 github webUI上操作。

运行到k8s集群

该项目可以运行到自己的k8s集群之中,需要构建重新为jupyterhub-k8s构建镜像和部署。   

参考:

快速使用教程

安装的支持库

  • jupyter, 包含 notebook, jupyterhub, jupyterlab webUI.
  • conda, 功能强大的python科学数据分析版, 使用 miniconda更小,只包含基本安装包。
  • mlflow,使用 mlflow进行机器学习,该库由databricks公司进行开发。
  • airflow, 数据流水线处理工具-airflow, 由Apache Software Foundation资助开发。
  • tushare, 金融数据获取sdk,提供中国金融相关数据, 基于python api。
  • matplotlib, 图形绘制库,在 jupyter notebook 中使用,先执行 %matplotlib inline。
  • ipyleaflet , 在Jupyter Notebook中显示地图,提供jupyterlab extension, 是 jupyter-widgets的一部分。

更多资源

© 著作权归作者所有

共有 人打赏支持
openthings
粉丝 257
博文 924
码字总数 475860
作品 1
东城
架构师
加载中

评论(1)

openthings
openthings
请注意,项目已经迁移到 https://github.com/databooks/databook
Docker build-容器构建加速攻略

容器构建时需要下载多种软件,往往这是非常耗时间的。hub.docker.com本来就慢,尤其是遇到存放在gcr.io/aws等上面的模块就挂了,pip安装python模块是也较慢,conda的下载更是如蜗牛。 加快容...

openthings
07/28
0
0
Python新手学习基础之数据结构-对数据结构的认知

什么是数据结构? 数据结构是指:相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成。 举个列子来理解这个数据结构: 数据可以比作是书本, 数据结构相当于书架...

MayaTeacher
2016/09/16
17
1
点评2009年十大PHP图书(前言)

我一直有逛书店(除了实体店就是网上书店了,当然网上书店我去的最多的还是china-pub,当然不是给他们做广告,是因为我是五星级会员,给我的折扣多些罢了。)的习惯,到PHP柜台(附:当然也包...

朱志兵
2010/12/23
0
0
简书程序员专题编委招募(进行中)

简书程序员专题招募进行中 简书 程序员专题 目前拥有54W+关注量,大量年轻程序员将简书作为自己的技术博客记录平台。 随着越来越多优秀程序员作者的入驻,程序员专题的运营工作也需要更多优秀...

简书大婶
2017/11/22
0
0
【简书招聘】大数据平台专家

我们是一家位于上海的互联网创业团队,我们的产品是「简书」: http://jianshu.com ,既有 Web 端,也有 iOS 和Android 的 app,目前已经进入了第五个年头。 也许你已经听说过,我们在 2014...

简书
2017/12/11
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

困扰当前数据中心管理的三大难题

导读 当企业发展到一定程度,或者之前的机房不能满足现在的数据中心使用时,企业会对数据中心进行迁移。那么在数据中心进行迁移的时候会遇到哪些风险呢?针对这些风险我们应该做出怎样的措施来...

问题终结者
12分钟前
0
0
设计模式:工厂方法模式(工厂模式)

工厂方法模式才是真正的工厂模式,前面讲到的静态工厂模式实际上不能说是一种真正意义上的设计模式,只是一种变成习惯。 工厂方法的类图: 这里面涉及到四个种类: 1、抽象产品: Product 2、...

京一
28分钟前
0
0
区块链和数据库,技术到底有何区别?

关于数据库和区块链,总会有很多的困惑。区块链其实是一种数据库,因为他是数字账本,并且在区块的数据结构上存储信息。数据库中存储信息的结构被称为表格。但是,区块链是数据库,数据库可不...

HiBlock
36分钟前
0
0
react native 开发碰到的问题

react-navigation v2 问题 问题: static navigationOptions = ({navigation, navigationOptions}) => ({ headerTitle: ( <Text style={{color:"#fff"}}>我的</Text> ), headerRight: ( <View......

罗培海
43分钟前
0
0
Mac Docker安装流程

久仰Docker大名已久,于是今天趁着有空,尝试了一下Docker 先是从docker的官网上下载下来mac版本的docker安装包,安装很简易,就直接拖图标就好了。 https://www.docker.com/products/docker...

writeademo
51分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部