文档章节

Databook-数据之书

openthings
 openthings
发布于 07/22 11:33
字数 523
阅读 46
收藏 0

Databook-数据之书

用于数据分析的Jupyter Notebooks。

快速创建步骤

  • 创建一个 github.com 账号。
  • 复制本代码仓库到自己的repository,点击fork即可。
  • 打开 https://mybinder.org , 填入上面的github repository地址,点击“launch”开始构建自己的远程服务。
  • 服务网页打开后,将后缀/tree改为/lab,以使用最新的多窗口界面。
  • 添加notebook, 然后运行、修改,shift+enter即可执行cell中的代码。
  • 提交更新到自己的 github repository, 通过运行 ./commit.sh。
  • https://github.com/databooks/databook 拉取更新, 运行 ./upstream-pull.sh.
  • 提交一个 pull-request, 将自己的 notebook 合并到上游 upstream, 需要从 github webUI上操作。

运行到k8s集群

该项目可以运行到自己的k8s集群之中,需要构建重新为jupyterhub-k8s构建镜像和部署。   

参考:

快速使用教程

安装的支持库

  • jupyter, 包含 notebook, jupyterhub, jupyterlab webUI.
  • conda, 功能强大的python科学数据分析版, 使用 miniconda更小,只包含基本安装包。
  • mlflow,使用 mlflow进行机器学习,该库由databricks公司进行开发。
  • airflow, 数据流水线处理工具-airflow, 由Apache Software Foundation资助开发。
  • tushare, 金融数据获取sdk,提供中国金融相关数据, 基于python api。
  • matplotlib, 图形绘制库,在 jupyter notebook 中使用,先执行 %matplotlib inline。
  • ipyleaflet , 在Jupyter Notebook中显示地图,提供jupyterlab extension, 是 jupyter-widgets的一部分。

更多资源

© 著作权归作者所有

共有 人打赏支持
openthings
粉丝 266
博文 992
码字总数 532040
作品 1
东城
架构师
加载中

评论(1)

openthings
openthings
请注意,项目已经迁移到 https://github.com/databooks/databook
Docker build-容器构建加速攻略

容器构建时需要下载多种软件,往往这是非常耗时间的。hub.docker.com本来就慢,尤其是遇到存放在gcr.io/aws等上面的模块就挂了,pip安装python模块是也较慢,conda的下载更是如蜗牛。 加快容...

openthings
07/28
0
0
Python新手学习基础之数据结构-对数据结构的认知

什么是数据结构? 数据结构是指:相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成。 举个列子来理解这个数据结构: 数据可以比作是书本, 数据结构相当于书架...

MayaTeacher
2016/09/16
17
1
点评2009年十大PHP图书(前言)

我一直有逛书店(除了实体店就是网上书店了,当然网上书店我去的最多的还是china-pub,当然不是给他们做广告,是因为我是五星级会员,给我的折扣多些罢了。)的习惯,到PHP柜台(附:当然也包...

朱志兵
2010/12/23
0
0
简书程序员专题编委招募(进行中)

简书程序员专题招募进行中 简书 程序员专题 目前拥有54W+关注量,大量年轻程序员将简书作为自己的技术博客记录平台。 随着越来越多优秀程序员作者的入驻,程序员专题的运营工作也需要更多优秀...

简书大婶
2017/11/22
0
0
【简书招聘】大数据平台专家

我们是一家位于上海的互联网创业团队,我们的产品是「简书」: http://jianshu.com ,既有 Web 端,也有 iOS 和Android 的 app,目前已经进入了第五个年头。 也许你已经听说过,我们在 2014...

简书
2017/12/11
0
0

没有更多内容

加载失败,请刷新页面

加载更多

软件测试工具书籍与面试题汇总下载(持续更新)

简介 本文是https://github.com/china-testing/python-api-tesing/blob/master/books.md 的节选。 欢迎转载,转载请附带此简介,谢谢! 试题 软件测试综合面试题(高级测试)-试题.pdf 软件测试...

python测试开发人工智能安全
22分钟前
0
0
java.sql.SQLException: Io 异常: The Network Adapter could not establish the connection 解决

有个项目使用的log4j进行日志记录的,同时也是用log4j中的数据库配置直接把相应级别的日志直接插入oracle。 在把项目部署的另一个内网环境时候,把项目的其他配置都改了,唯独log4j中的数据库...

哥本哈根的小哥
32分钟前
0
0
耗时 2 年,用 8.5 万块乐高积木最牛复刻 Apple Park

简评:国外大佬复刻 Apple Park,看了一下细节,确实厉害!只有你想不到,没有乐高拼不起来的,有没有乐高大神挑战一下? 苹果公园以各种各样的方式鼓舞人心,让人感兴趣。从建筑、可持续性和...

极光推送
33分钟前
0
0
记一次查找Hdfs磁盘占用空间比实际存储文件大4倍的原因

在一次主备namenode发生切换后,重启datanode节点,发现磁盘空间很大,想清理一下磁盘, 通过命令Hdfs dfs -du -h --max-depth=1 / 发现实际文件的大小只有8g,通过du -h --max-depth=1 /ha...

PageYi
今天
5
0
阿里云推荐引擎使用教程

产品概述: 推荐引擎(Recommendation Engine,以下简称RecEng,特指阿里云推荐引擎)是在阿里云计算环境下建立的一套推荐服务框架,目标是让广大中小互联网企业能够在这套框架上快速的搭建满...

mcy0425
今天
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部