文档章节

k8s-调度器、预选策略及优选函数-二十

o
 osc_n6euf5h6
发布于 2019/03/19 18:39
字数 1739
阅读 14
收藏 0

精选30+云产品,助力企业轻松上云!>>>

一、简介

master上运行着三个最核心的组件,apiserver、scheduler、controller manager。此外,master还依赖于ectd存储节点,最好ectd是有冗余能力的集群;

(1)调度器(scheduler)

  • master上的scheduler控制着pod运行在哪个node上,默认用的default scheduler;
  • 调度器的调度信息存储在master上的etcd里面,apiserver负责和etcd通信;
  • kubelete运行在node节点上,监控着Node节点上的pod状态,并参与pod的创建等工作;
  • kube-proxy也运行在node节点上,它监控着service资源的变动;
  • kubelete和kube-proxy都要连接master上的apiserver去获取定义信息;

(2)预选步骤

a、default scheduler是通过三个步骤来实现调度的:

  • 预选策略(predicate):先排除那些完全不符合此pod运行法则的节点,有两个维度来排除,一个是最低资源需求,即节点必须满足此Pod的最低资源;第二个是资源限额,即当前节点最多能给pod提供的资源;
  • 优选(priority):在符合节点找到最佳匹配的节点;
  • 绑定(select):把pod绑定到优选的节点上,如果有多个最佳节点,就会随机选一个;

b、kubernetes的调度方式

  • nodeaffinity,表示node亲和性调度,表示这个pod对这个节点有一定的倾向性。我们通过上面的nodeselector来完成这类调度;
  • podaffinity或podunaffinity:pod亲和性或者pod反亲和性调度,有时我们期望某些Pod运行在同一个节点上或者是相邻的节点上,或者我们期望某些Pod不要运行在某些节点上;
  • taints和tolerations:污点和污点容忍调度:可以在某些节点上打上污点,表示这些节点不让pod在其上面运行。taints是定义在节点之上的,tolerations是定义在pod之上的;

(3)常用的预选策略

k8s的预选策略很多,此处可以看源码:https://github.com/kubernetes/kubernetes/blob/master/pkg/scheduler/algorithm/predicates/predicates.go

a、ChekNodeCondition

表示检查是否可以在节点磁盘、网络不可用,或未准备好的前提下,能够把pod调度到上去。

b、GeneralPredicate

[root@master ~]# kubectl describe nodes node01    #查看节点资源使用

查看资源定义清单字段:
[root@master ~]# kubectl explain pods.spec
[root@master ~]# kubectl explain pods.spec.containers.ports
  • hostname  表示如果pod定义了hostname属性(pod.spec.hostname),则检查节点的名字跟pod的hostname是否想匹配,但这里并不是定义这个pod必须运行在这些节点上;
  • PodFitsHostPorts:如果节点定义了hostport属性(pod.spec.containers.ports.hostPort),表示指定在节点的哪个端口上。如果这个节点的端口被占用了,那么这个节点就不适合运行这个pod;
  • MatchNodeSelector:检查pods.spec.nodeSelector这个字段你是否定义了,运行在携有这有这些标签选择器的节点上;
  • PodFitsResources:检查节点是否有足够的资源来支持这个pod运行;

c、NoDiskConfict

检查Pod所请求的存储卷类型在此节点上是否不可用。 NoDiskConfict调度策略默认没有启用。

d、PodToleratesNodeTaints

如果Pod定义了Tolerates(容忍度),即 pods.spec.tolerations,那么就看pod能不能容忍节点上的污点,如果是,表示这个节点可以被选定;

e、PodToleratesNodeNoExecuteTaints

检查pod是否容忍节点上有NoExecute污点。NoExecute污点:如果一个pod上运行在一个没有污点的节点上,后来这个节点又给加上污点了,那么NoExecute表示这个新加污点的节点会去除其上正在运行的pod;此调度策略默认没有启用;

f、CheckNodeLabelPresence

检查节点上指定标签的存在性,如果节点有pod指定的标签,那么这个节点就被选中。 此调度策略默认没有启用;

g、CheckServceAffinity

一个service下可以有多个pod,比如这些pod都运行在1、2、3机器上,而没有运行在4、5、6机器上,那么CheckServceAffinity就表示新加入的pod都集中运行在1、2、3机器上,这样集中好处是一个service下pod之间内部通信的效率变高了。 这个策略默认也是没有启用的。

h、MaxEBSVolumeCountPred

检查节点上挂载的EBS存储器(亚马逊的弹性块存储)的数量是否超出了最大的设定值。一般来说,一个节点上最多可以挂载39个存储卷。可以编译安装k8s指定该值;

i、MaxGCEPDVolumeCountPred

GCE是谷歌的云存储引擎。可以编译安装k8s指定该值。

j、 MaxAzureDiskVolumeCountPred

pod会选择挂载足量Azure存储卷的节点。 

k、CheckVolumeBinding

检查节点上的pvc是否被别的pod绑定了;

l、NoVolumeZoneConfict

检查节点上的pod是否与pod的需求冲突;

m、CheckNodeMemoryPressure

检查节点内存是否存在压力;

n、CheckNodePIDpressure

检查节点pid数量是否压力过大,但一般pid是可以重复使用的;

o、CheckNodeDiskPressure

检查内存/磁盘 IO是否压力过大;

p、MatchInterPodAffinity

检查Pod是否满足亲和性或者反亲和性;

pod在调度的时候,以上策略要逐一评估;

 

(4)常用的优选函数

函数源码:https://github.com/kubernetes/kubernetes/tree/master/pkg/scheduler/algorithm/priorities

  • least_requested.go:最少请求,空闲比例。对cpu来说,用cpu((capacity-sum(requested))*10/capacity)方式进行评估,得分最高的胜出;
  • balanced_resource_allocation.go:均衡资源的使用方式,表示以cpu和内存占用率的相近程度(均衡)作为评估标准,二者占用越接近,得分就越高,得分高的胜出。
  • node_prefer_avoid_pods.go:看节点是否有注解信息"scheduler.alpha.kubernetes.io/preferAvoidPods"。没有这个注解信息,说明这个节点是适合运行这个pod的。
  • taint_toleration.go:将pod对象的spec.toleration与节点的taint列表项进行匹配度检查,匹配的条目越多,得分越低;
  • selector_spreading.go:查找当前pod对象对应的service,statefulset,replicatset等所匹配的标签选择器,在节点上运行的带有这样标签的pod越少得分越高,这样的pod优选被选出。 这就是说我们要把同一个标签选择器下运行的pod散开(spreading)到多个节点上;
  • interpod_affinity.go:遍历Pod对象亲和性的条目,并将那些能够匹配到节点权重相加,值越大的得分越高,得分高的胜出;
  • node_affinity.go:根据pod对象中的nodeselector,对节点进行匹配度检查,能够成功匹配的数量越多,得分就越高;
  • most_requested.go:表示尽可能的把一个节点的资源先用完,这个和least_requested相反,二者不能同时使用;未启用;
  • node_label.go:根据节点是否拥有标签,来评估分数;未启用;
  • image_locality.go:表示根据满足当前pod运行需要的已有镜像体积大小之和来选择节点的;未启用;

以上优选函数会逐一评估,最后得分相加;

 

 

 

o
粉丝 0
博文 500
码字总数 0
作品 0
私信 提问
加载中
请先登录后再评论。
k8s的pod的资源调度

1、常用的预选策略 2、优选函数 3、节点亲和调度 3.1、节点硬亲和性 3.2、节点软亲和性 4、Pod资源亲和调度 4.1、Pod硬亲和度 4.2、Pod软亲和度 4.3、Pod反亲和度 5、污点和容忍度 5.1、定义...

osc_m8nx82a1
2019/06/29
2
0
k8s调度的预选策略及优选函数

scheduler调度过程: Predicate(预选)-->Priority(优选)-->Select(选定) 调度方式: 1.节点亲和性调度(NodeAffinity)使用nodeSelector完成这类调度。 2.Pod亲和性和反亲和性调度(P...

osc_nubdt7rk
2019/05/28
1
0
十三. k8s--调度器

[TOC] k8s调度器 <table><tr><td bgcolor=#C0FF3E><font>Scheduler调度器做为Kubernetes三大核心组件之一, 承载着整个集群资源的调度功能,其根据特定调度算法和策略,将Pod调度到最优工作节......

osc_0cqshtia
2019/09/24
1
0
Kubernetes调度器,预选策略以及优选函数以及高级调度

版权声明:知识就是为了传播! https://blog.csdn.net/weixin_36171533/article/details/82757713 k8s调度器是允许自定义的 1.k8s的调度算法会从众多node选出适用的调度算法 2.预选过程是排除...

JESSE_JAVA
2018/09/18
0
0
kube-scheduler调度扩展

正文 Kubernetes 自带了一个默认调度器kube-scheduler,其内置了很多节点预选和优选的调度算法,一般调度场景下可以满足要求。但是在一些特殊场景下,默认调度器不能满足我们复杂的调度需求。...

osc_whnk6pd5
04/16
2
0

没有更多内容

加载失败,请刷新页面

加载更多

Buffer的创建及使用源码分析——ByteBuffer为例

目录 Buffer概述 Buffer的创建 Buffer的使用 总结 参考资料 Buffer概述 注:全文以ByteBuffer类为例说明 在Java中提供了7种类型的Buffer,每一种类型的Buffer根据分配内存的方式不同又可以分为...

osc_zoa046qb
26分钟前
21
0
《 ZooKeeper : Wait-free coordination for Internet-scale systems 》论文研读

Zookeeper 研读 说明:本文为论文 《 ZooKeeper : Wait-free coordination for Internet-scale systems 》 的个人理解,难免有理解不到位之处,欢迎交流与指正 。 论文地址:Zookeeper Paper...

osc_4isxawz4
27分钟前
19
0
利用__new__实现单例模式

26 利用__new__实现单例模式 python当中有很多方法都可以实现单例模式, 但利用__new__无疑是最推荐的方式. 代码如下: class Demo:is_instance = Nonedef __new__(cls, *args, **kwargs...

_Change_
29分钟前
11
0
如何白嫖微软Azure12个月及避坑指南

Azure是微软提供的一个云服务平台。是全球除了AWS外最大的云服务提供商。Azure是微软除了windows之外另外一个王牌,微软错过了移动端,还好抓住了云服务。这里的Azure是Azure国际不是Azure中...

osc_dwuu5jqk
29分钟前
21
0
Mybatis源码初探——优雅精良的骨架

@ 目录 前言 精良的Mybatis骨架 宏观设计 基础支撑 日志 日志的加载 日志的使用 数据源 数据源的创建 池化技术原理 数据结构 获取连接 回收连接 缓存 缓存的实现 CacheKey 反射 总结 前言 My...

osc_r9wwwi0j
30分钟前
11
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部