文档章节

Databook-数据之书

openthings
 openthings
发布于 2018/07/22 11:33
字数 523
阅读 61
收藏 0

Databook-数据之书

用于数据分析的Jupyter Notebooks。

快速创建步骤

  • 创建一个 github.com 账号。
  • 复制本代码仓库到自己的repository,点击fork即可。
  • 打开 https://mybinder.org , 填入上面的github repository地址,点击“launch”开始构建自己的远程服务。
  • 服务网页打开后,将后缀/tree改为/lab,以使用最新的多窗口界面。
  • 添加notebook, 然后运行、修改,shift+enter即可执行cell中的代码。
  • 提交更新到自己的 github repository, 通过运行 ./commit.sh。
  • https://github.com/databooks/databook 拉取更新, 运行 ./upstream-pull.sh.
  • 提交一个 pull-request, 将自己的 notebook 合并到上游 upstream, 需要从 github webUI上操作。

运行到k8s集群

该项目可以运行到自己的k8s集群之中,需要构建重新为jupyterhub-k8s构建镜像和部署。   

参考:

快速使用教程

安装的支持库

  • jupyter, 包含 notebook, jupyterhub, jupyterlab webUI.
  • conda, 功能强大的python科学数据分析版, 使用 miniconda更小,只包含基本安装包。
  • mlflow,使用 mlflow进行机器学习,该库由databricks公司进行开发。
  • airflow, 数据流水线处理工具-airflow, 由Apache Software Foundation资助开发。
  • tushare, 金融数据获取sdk,提供中国金融相关数据, 基于python api。
  • matplotlib, 图形绘制库,在 jupyter notebook 中使用,先执行 %matplotlib inline。
  • ipyleaflet , 在Jupyter Notebook中显示地图,提供jupyterlab extension, 是 jupyter-widgets的一部分。

更多资源

© 著作权归作者所有

共有 人打赏支持
openthings
粉丝 286
博文 1052
码字总数 574209
作品 1
东城
架构师
私信 提问
加载中

评论(1)

openthings
openthings
请注意,项目已经迁移到 https://github.com/databooks/databook
Docker build-容器构建加速攻略

容器构建时需要下载多种软件,往往这是非常耗时间的。hub.docker.com本来就慢,尤其是遇到存放在gcr.io/aws等上面的模块就挂了,pip安装python模块是也较慢,conda的下载更是如蜗牛。 加快容...

openthings
2018/07/28
0
0
Python新手学习基础之数据结构-对数据结构的认知

什么是数据结构? 数据结构是指:相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成。 举个列子来理解这个数据结构: 数据可以比作是书本, 数据结构相当于书架...

MayaTeacher
2016/09/16
17
1
点评2009年十大PHP图书(前言)

我一直有逛书店(除了实体店就是网上书店了,当然网上书店我去的最多的还是china-pub,当然不是给他们做广告,是因为我是五星级会员,给我的折扣多些罢了。)的习惯,到PHP柜台(附:当然也包...

朱志兵
2010/12/23
0
0
简书程序员专题编委招募(进行中)

简书程序员专题招募进行中 简书 程序员专题 目前拥有54W+关注量,大量年轻程序员将简书作为自己的技术博客记录平台。 随着越来越多优秀程序员作者的入驻,程序员专题的运营工作也需要更多优秀...

简书大婶
2017/11/22
0
0
用pl/sql实现oracle数据的导出和导入

一、PL/SQL工具实现oracle数据导出 1. 数据对象导出 工具->导出用户对象,弹出如下界面: 选择用户,选择导出文件的路径,命名导出文件名称(.sql),然后点击导出即可。 注意:此方法只能导...

为自己插上翅膀
2018/01/23
0
0

没有更多内容

加载失败,请刷新页面

加载更多

OSChina 周一乱弹 —— 白掌柜说了卖货不卖身

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @爱漫爱 :这是一场修行分享羽肿的单曲《Moony》 手机党少年们想听歌,请使劲儿戳(这里) @clouddyy :开不开心? 开心呀, 我又不爱睡懒觉…...

小小编辑
今天
7
0
大数据教程(11.7)hadoop2.9.1平台上仓库工具hive1.2.2搭建

上一篇文章介绍了hive2.3.4的搭建,然而这个版本已经不能稳定的支持mapreduce程序。本篇博主将分享hive1.2.2工具搭建全过程。先说明:本节就直接在上一节的hadoop环境中搭建了! 一、下载apa...

em_aaron
今天
2
0
开始看《JSP&Servlet学习笔记》

1:WEB应用简介。其中1.2.1对Web容器的工作流程写得不错 2:编写Servlet。搞清楚了Java的Web目录结构,以及Web.xml的一些配置作用。特别是讲了@WebServlet标签 3:请求与响应。更细致的讲了从...

max佩恩
今天
4
0
mysql分区功能详细介绍,以及实例

一,什么是数据库分区 前段时间写过一篇关于mysql分表的的文章,下面来说一下什么是数据库分区,以mysql为例。mysql数据库中的数据是以文件的形势存在磁盘上的,默认放在/mysql/data下面(可...

吴伟祥
今天
3
0
SQL语句查询

1.1 排序 通过order by语句,可以将查询出的结果进行排序。放置在select语句的最后。 格式: SELECT * FROM 表名 ORDER BY 排序字段ASC|DESC; ASC 升序 (默认) DESC 降序 1.查询所有商品信息,...

stars永恒
今天
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部