加载中
vivo基于Kubernetes构建企业级TaaS平台实践

最近越来越多的同学找我讨论 “TensorFlow on Kubernetes” 的方案和实践,这说明越来越多的企业开始基于Kubernetes和TensorFlow来构建自己的深度学习平台,我们非常愿意同大家交流和分享我们...

2018/01/11 23:29
374
Kubelet PLEG源码分析

xidianwangtao@gmail.com 摘要:PLEG(Pod Lifecycle Event Generator)是kubelet的核心模块,在kubelet/docker相关的许多问题定位时,我们经常能看到PLEG的异常日志。通过对PLEG的源码分析,希...

深入分析Kubelet Bootstrap Checkpoint

Author: xidianwangtao@gmail.com , Version: Kubernetes 1.12 摘要:本文对Kubelet Bootstrap Checkpoint的使用方法、应用场景、工作机制及其代码工作流程进行了全面分析,目前仍处于Alpha...

如何落地TensorFlow on Kubernetes

TensorFlow 作为最受欢迎的 Deep Learning 框架,已经火到没有朋友,然而在落地时,你会发现 TensorFlow 也并不是那么完美,它面临着资源隔离、进程难于管理、 PS 进程不能自动结束等诸多问题...

Flannel是如何工作的

年前我们的TaaS平台遇到很多的网络问题(contiv + ovs +vlan),时间紧迫,只能使用“Flannel + host-gw”这个简单、稳定的网络方案搭建一个小规模的集群来作为紧急备选方案。本文介绍了Flann...

2018/02/26 23:51
2.3K
深入分析Kubernetes Critical Pod(一)

大家在Kubernetes集群中部署核心组件时,经常会用到Critical Pod,那么你知道Critical Pod到底有何特别吗?要完整的了解这一点,其实并不是那么简单,它关系到调度、Kubelet Eviction Manage...

深入分析Kubelet的动态配置

Author: xidianwangtao@gmail.com Kubernetes 1.13 摘要:Kubelet动态配置可以使让我们及其方便的大规模更新集群Kubelet配置,让我们可以像配置集群中其他应用一样通过ConfigMap配置Kubelet...

深入分析Kubernetes DaemonSet Controller

Author: xidianwangtao@gmail.com | Version: Kubernetes 1.13 摘要:DaemonSet是Kubernetes中用户最常用的对象之一,我们用它来部署Nodes上守护应用,比如日志组件、节点监控组件等。从用户...

深入分析Kubernetes Scheduler的优先级队列

从1.9版本开始,Kubernetes实现了基于Pod优先级的调度队列,一方面提供高优先级的Pod优先被调度的能力,另一方面减轻抢占式调度时潜在的High Priority Pod Starvation的问题,截止Kubernete...

深入理解 Kubernetes CPU Mangager

Author: xidianwangtao@gmail.com 摘要:Kuberuntime CPU Manager在我们生产环境中有大规模的应用,我们必须对其有深入理解,方能运筹帷幄。本文对CPU Manager的使用场景、使用方法、工作机制...

2018/11/10 23:45
440
Kubernetes Local Persistent Volume源码分析

Author: xidianwangtao@gmail.com 摘要:上一篇博客”深度解析Kubernetes Local Persistent Volume“对local volume的基本原理和注意事项进行了分析,本文将进行源码分析,涉及scheduler、p...

解析Kubernetes 1.8中的基于Pod优先级的抢占式调度

在 1.8 的发布版本中,SIG Scheduling 通过引入 Pod 优先级和抢占特性扩展了共享集群的概念。这些特性允许在单一集群中混合运行不同类型的应用和任务,提高了集群的利用率和可用性。这些特性...

私有云中Kubernetes Cluster HA方案

发现很多Kubernetes刚入门的同学对Kubernetes的Master高可用方案很感兴趣,官方又只给出了GCE上部署高可用的方案,因此我觉得有必要把我之前做的Kubernetes Master HA方案分享一下。...

2017/10/25 22:23
2K
利用Kubernetes和Helm进行高效的超参数调优

Author: xidianwangtao@gmail.com 摘要:本文将讨论Hyperparameter调优在落地时面临的问题,以及如何利用Kubernetes+Helm解决这些问题。 Hyperparameter Sweep面临的问题 在进行Hyperparame...

深入分析Kubernetes Critical Pod(四)

摘要:本文分析了DeamonSetController及PriorityClass Validate时,对CriticalPod的所做的特殊处理。 Daemonset Controller对CriticalPod的特殊处理 深入分析Kubernetes Critical Pod系列: ...

深入分析Kubernetes Critical Pod(二)

深入分析Kubernetes Critical Pod(一)介绍了Scheduler对Critical Pod的处理逻辑,下面我们再看下Kubelet Eviction Manager对Critical Pod的处理逻辑是怎样的,以便我们了解Kubelet Evict P...

2018/07/12 23:54
118
剖析Kubernetes EnableEquivalenceClassCache提升Scheduler吞吐量的工作机制

Equivalence Class是用来给Kubernetes Scheduler加速Predicate,从而提升Scheduler的吞吐性能。Kubernetes scheduler维护着Equivalence Cache的数据,当有Pod进入到Predicate阶段时,会先从E...

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部