加载中
40天14大版本升级,腾讯会议背后大规模容器技术实践

春节前后因受新冠肺炎疫情影响,在线办公应用迅速火爆,腾讯会议作为一款企业级在线办公产品,迅速受到用户认可。用户数在爆炸式增长的同时,业务也在高速的迭代升级,40天完成14大版本升级,...

腾讯自研业务上云:优化Kubernetes集群负载的技术方案探讨

Author: xidianwangtao@gmail.com 摘要:Kubernetes的资源编排调度使用的是静态调度,将Pod Request Resource与Node Allocatable Resource进行比较来决定Node是否有足够资源容纳该Pod。静态调...

如何在Kubernetes中实现容器原地升级

Author: xidianwangtao@gmail.com, Based Kubernetes 1.12 摘要:在Kubernetes中,Pod是调度的基本单元,也是所有内置Workload管理的基本单元,无论是Deployment还是StatefulSet,它们在对管...

2019/04/15 21:33
6.3K
深入分析Kubernetes DaemonSet Controller

Author: xidianwangtao@gmail.com | Version: Kubernetes 1.13 摘要:DaemonSet是Kubernetes中用户最常用的对象之一,我们用它来部署Nodes上守护应用,比如日志组件、节点监控组件等。从用户...

2019/03/10 22:49
3.7K
Kubernetes集群中,Node异常时Pod状态分析

摘要:Kubernetes集群中Node NotReady是经常遇到的现象,我们需要了解各种Workload Type对应的Pod此时的行为。文中只给出现象总结,并没有写出对应的逻辑分析,因为这主要是Node Controller...

2019/02/28 23:57
2.1K
Kubernetes中Pod间共享内存方案

Author: xidianwangtao@gmail.com 摘要:一些公共服务组件在追求性能过程中,与业务耦合太紧,造成在制作基础镜像时,都会把这些基础组件都打包进去,因此当业务镜像启动后,容器里面一大堆进...

2019/01/27 11:02
9.2K
深入分析Kubelet的动态配置

Author: xidianwangtao@gmail.com Kubernetes 1.13 摘要:Kubelet动态配置可以使让我们及其方便的大规模更新集群Kubelet配置,让我们可以像配置集群中其他应用一样通过ConfigMap配置Kubelet...

深入分析Kubelet Bootstrap Checkpoint

Author: xidianwangtao@gmail.com , Version: Kubernetes 1.12 摘要:本文对Kubelet Bootstrap Checkpoint的使用方法、应用场景、工作机制及其代码工作流程进行了全面分析,目前仍处于Alpha...

深入理解 Kubernetes CPU Mangager

Author: xidianwangtao@gmail.com 摘要:Kuberuntime CPU Manager在我们生产环境中有大规模的应用,我们必须对其有深入理解,方能运筹帷幄。本文对CPU Manager的使用场景、使用方法、工作机制...

2018/11/10 23:45
4.3K
Kubernetes Endpoints Controller源码分析

Author: xidianwangtao@gmail.com 摘要:最近我们在写自己的Kubernetes服务路由组件对接公司自研的负载均衡器,这其中涉及到非常核心的Endpoints相关的逻辑,因此对Endpoints Controller的深...

2018/11/04 23:37
3.4K
Kubelet PLEG源码分析

xidianwangtao@gmail.com 摘要:PLEG(Pod Lifecycle Event Generator)是kubelet的核心模块,在kubelet/docker相关的许多问题定位时,我们经常能看到PLEG的异常日志。通过对PLEG的源码分析,希...

Kubernetes Local Persistent Volume源码分析

Author: xidianwangtao@gmail.com 摘要:上一篇博客”深度解析Kubernetes Local Persistent Volume“对local volume的基本原理和注意事项进行了分析,本文将进行源码分析,涉及scheduler、p...

利用Kubernetes和Helm进行高效的超参数调优

Author: xidianwangtao@gmail.com 摘要:本文将讨论Hyperparameter调优在落地时面临的问题,以及如何利用Kubernetes+Helm解决这些问题。 Hyperparameter Sweep面临的问题 在进行Hyperparame...

深度解析Kubernetes Local Persistent Volume

摘要:本文分析了hostPath volume缺陷,然后对local persistent volume的使用场景、基本的工作机制进行了分析,介绍了使用时的注意事项,并简单介绍local volume manager如何帮助administrat...

2018/08/25 21:38
2.1W
深入分析Kubernetes Critical Pod(四)

摘要:本文分析了DeamonSetController及PriorityClass Validate时,对CriticalPod的所做的特殊处理。 Daemonset Controller对CriticalPod的特殊处理 深入分析Kubernetes Critical Pod系列: ...

深入分析Kubernetes Critical Pod(三)

本文介绍了Kubelet在Predicate Admit准入检查时对CriticalPod的资源抢占的原理,以及Priority Admission Controller对CriticalPod的PriorityClassName特殊处理。 深入分析Kubernetes Critic...

2018/07/12 23:55
660
深入分析Kubernetes Critical Pod(二)

深入分析Kubernetes Critical Pod(一)介绍了Scheduler对Critical Pod的处理逻辑,下面我们再看下Kubelet Eviction Manager对Critical Pod的处理逻辑是怎样的,以便我们了解Kubelet Evict P...

2018/07/12 23:54
362
深入分析Kubernetes Critical Pod(一)

大家在Kubernetes集群中部署核心组件时,经常会用到Critical Pod,那么你知道Critical Pod到底有何特别吗?要完整的了解这一点,其实并不是那么简单,它关系到调度、Kubelet Eviction Manage...

使用Dubbo+Kubernetes部署线上的TensorFlow Serving服务

Author: xidianwangtao@gmail.com 摘要:本文介绍了在Kubernetes集群中,使用Dubbo+Zookeeper来完成TensorFlow Serving服务的注册与发现、负载均衡的方案,以及使用KubeDNS+Kube2LVS的方案。...

2018/06/10 13:07
2.4K

没有更多内容

加载失败,请刷新页面

返回顶部
顶部