Kubeflow 0.1 发布,基于 Kubernetes 的机器学习工具库

Google 发布了 Kubeflow 开源工具 0.1 版本,该工具旨在将机器学习带入 Kubernetes 容器的世界。该项目背后的想法是让数据科学家充分利用在 Kubernetes 集群上运行机器学习任务的优势。Kubef...

局长
2018/05/07
1K
1
最佳实践系列丨Docker EE 大规模部署指南(二)

本文首发自“Docker公司”公众号(ID:docker-cn) 编译丨小东 每周一、三、五 与您不见不散! 前情回顾 此参考架构将帮助您规划大规模 Docker 企业版部署。它涉及核心 Docker EE 平台、Uni...

docker公司
2018/06/08
0
0
Kubeflow实战系列: 利用TFJob运行分布式TensorFlow

介绍 本系列将介绍如何在阿里云容器服务上运行Kubeflow, 本文介绍如何使用运行分布式模型训练。 第一篇:阿里云上使用JupyterHub 第二篇:阿里云上小试TFJob 第三篇:利用TFJob运行分布式Ten...

Mr_zebra
2018/06/14
93
0
业界 | 谷歌发布机器学习工具库Kubeflow:可提供最佳OSS解决方案

  选自GitHub   机器之心编译      Kubeflow 是谷歌发布的一个机器学习工具库,致力于使运行在 Kubernetes 上的机器学习变的更轻松、便捷和可扩展;Kubeflow 的目标不是重建其他服务...

机器之心
2017/12/11
0
0
基于阿里云容器服务监控 Kubernetes集群GPU指标

简介 当您在阿里云容器服务中使用GPU ECS主机构建Kubernetes集群进行AI训练时,经常需要知道每个Pod使用的GPU的使用情况,比如每块显存使用情况、GPU利用率,GPU卡温度等监控信息,本文介绍如...

萧元
2018/10/08
0
0

没有更多内容

加载失败,请刷新页面

加载更多