k8s pod被驱逐时间问题

编程入门 行业动态 更新时间:2024-10-09 00:43:20

k8s pod被驱逐<a href=https://www.elefans.com/category/jswz/34/1771441.html style=时间问题"/>

k8s pod被驱逐时间问题

在默认配置下,k8s节点故障时,工作负载的调度周期约为6分钟,
参数概念:
  • node-monitor-period
    节点控制器(node controller) 检查每个节点的间隔,默认5秒。
  • node-monitor-grace-period
    节点控制器判断节点故障的时间窗口, 默认40秒。即40 秒没有收到节点消息则判断节点为故障。
  • pod-eviction-timeout
    当节点故障时,kubelet允许pod在此故障节点的保留时间,默认300秒。即当节点故障5分钟后,kubelet开始在其他可用节点重建pod。
    5+40+300 ≈ 6分钟

kubernetes节点失效后pod的调度过程:

  • 0、Master每隔一段时间和node联系一次,判定node是否失联,这个时间周期配置项为 node-monitor-period ,默认5s

  • 1、当node失联后一段时间后,kubernetes判定node为notready状态,这段时长的配置项为 node-monitor-grace-period ,默认40s

  • 2、当node失联后一段时间后,kubernetes判定node为unhealthy,这段时长的配置项为 node-startup-grace-period ,默认1m0s

  • 3、当node失联后一段时间后,kubernetes开始删除原node上的pod,这段时长配置项为 pod-eviction-timeout ,默认5m0s
    以下我的参数

vim /etc/kubernetes/manifests/kube-controller-manager.yaml


更多详细参数见官网:点击

最后再设置pods漂移时间
方法 1 统一设置时间

vim  /etc/kubernetes/manifests/kube-apiserver.yaml
添加以下参数- --default-not-ready-toleration-seconds=30- --default-unreachable-toleration-seconds=30

方法.2
再yaml文件上配置

#调整默认容忍时长
1 Kubernetes 为 Pod 自动添加的针对 unreachable / not-ready 污点的容忍时长由 APIServer 中的相应参数控制,如需修改请逐台在三台 Master 节点上进行如下操作:在 APIServer 配置文件/etc/kubernetes/apiserver 中添加参数 --default-not-ready-toleration-seconds=100 及 --default-unreachable-toleration-seconds=100,将对污点 NotReady:NoExecute 及 Unreachable:NoExecute 的容忍时长(以秒记,默认为 300)调整为 100s,修改前请做好配置文件备份;2. 执行 systemctl restart kube-apiserver 重启 APIServer3 . 执行 systemctl status kube-apiserver 确认 APIServer 状态为 active。spec:template:spec:tolerations:- key: "node.kubernetes.io/unreachable"operator: "Exists"effect: "NoExecute"# 调整 Pod 对污点 Unreachable:NoExecute 的容忍时长为 100stolerationSeconds: 100- key: "node.kubernetes.io/not-ready"operator: "Exists"effect: "NoExecute"# 调整 Pod 对污点 NotReady:NoExecute 的容忍时长为 100stolerationSeconds: 100
      nodeSelector:storagenode: momotolerations:- key: "node.kubernetes.io/unreachable"operator: "Exists"effect: "NoExecute"tolerationSeconds: 10- key: "node.kubernetes.io/not-ready"operator: "Exists"effect: "NoExecute"tolerationSeconds: 10

更多推荐

k8s pod被驱逐时间问题

本文发布于:2024-03-09 18:46:45,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1725783.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:时间   k8s   pod

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!