解决Kubernetes Pod DNS超时问题

最近刚给公司测试环境上了K8s,大部分容器采用得是以alpine为基础的镜像,基础服务如MySQL、Redis等以域名的方式连接,但是出现一个很奇怪的现象,部分Pod内应用报DNS超时,大概报错日志是这样的(JAVA):io.netty.resolver.dns.DnsNameResolverTimeoutException: [/10.96.0.10:53] query timed out after 5000 milliseconds (no stack trace available)
?
网上搜了一下,似乎K8s环境中使用alpine作镜像就会出现这个问题,参考了这篇文章:https://forum.choerodon.io/t/topic/1111, 尝试解决方法如下
1、使用移除解析AAAA记录的alpine修改版镜像,并安装了glibc以支持java,镜像地址:https://hub.docker.com/r/geekidea/alpine-a/无效
2、文章中提到非alpine镜像,可以通过修改/etc/resolv.conf增加options single-request-reopen解决问题,alpine镜像不行,原因是非alpine镜像采用的glibc,而alpine默认使用的是musl libc,想着我们用的alpine已经安装glibc,可不可以用这个方法试一下,于是尝试修改,在YAML中加入下面这段:

        lifecycle:
          postStart:
            exec:
              command:
              - /bin/sh
              - -c
              - "/bin/echo ‘options single-request-reopen‘ >> /etc/resolv.conf"

注意:这里不能直接使用sed替换,会报错。
还是无效

重新理清思路,会不会是自动生成的/etc/resolv.conf有问题,造成DNS不正常,查看Pod的/etc/resolv.conf,原始文件内容如下:

nameserver 10.96.0.10
search test1.svc.cluster.local  svc.cluster.local cluster.local
options ndots:5

尝试ping test1.svc.cluster.local
ping svc.cluster.local
ping cluster.local
发现后两个根本无法ping通,难道这两个搜索域引起DNS超时,于是决定试试不使用默认生成的/etc/resolv.conf,自己写,查看K8s官方文档,原来官方就提供类似配置,在YAML的spec段加入如下配置:

      dnsPolicy: "None"
      dnsConfig:
        nameservers:
        - 10.96.0.10
        searches:
        - test1.svc.cluster.local
        options:
        - name: single-request-reopen

注意nameservers为kube-dns的ClusterIP,searches(搜索域)根据你的实际环境配置
生成的/etc/resolv.conf如下:

nameserver 10.96.0.10
search test1.svc.cluster.local
options single-request-reopen

尝试多次删除Pod,创建Pod,问题不再复现,原来罪魁祸首就出在resolv.conf的搜索域配置中,具体原理等以后有空再去研究一下,最近没时间:)

原文地址:https://blog.51cto.com/kusorz/2387623

时间: 2024-08-30 12:18:13

解决Kubernetes Pod DNS超时问题的相关文章

Kubernetes Pod故障归类与排查方法

Pod概念 Pod是kubernetes集群中最小的部署和管理的基本单元,协同寻址,协同调度. Pod是一个或多个容器的集合,是一个或一组服务(进程)的抽象集合. Pod中可以共享网络和存储(可以简单理解为一个逻辑上的虚拟机,但并不是虚拟机). Pod被创建后用一个UID来唯一标识,当Pod生命周期结束,被一个等价Pod替代时UID将重新生成. Kubernetes Pod中最常用Docker容器运行,当然Pod也能支持其他的容器运行,比如rkt.podman等. Kubernetes集群中的P

Python Django撸个WebSSH操作Kubernetes Pod(下)- 终端窗口自适应Resize

追求完美不服输的我,一直在与各种问题斗争的路上痛并快乐着 上一篇文章Django实现WebSSH操作Kubernetes Pod最后留了个问题没有解决,那就是terminal内容窗口的大小没有办法调整,这会导致的一个问题就是浏览器上可显示内容的区域太小,当查看/编辑文件时非常不便,就像下边这样,红色可视区域并没有被用到 RESIZE_CHANNEL 前文说到kubectl exec有两个参数COLUMNS和LINES可以调整tty内容窗口的大小,命令如下: kubectl exec -i -t

ecshop 完美解决动态ip登录超时和购物车清空问题

ecshop 完美解决动态ip登录超时和购物车清空问题 ECSHOP模板/ecshop开发中心(www.68ecshop.com) / 2014-05-06 前一段时间,ECSHOP开发中心的一个客户说自己的ecshop网店出了状况,就是有时候登录的时候会自动退出.而且购物车也没规律的会清空.刚开始一直找不到原因,到最后才知道了.他说的状况是由于像学校,公司一类的局域网.ip变化的原因造成的.ecshop存登录和购物车信息的时候用的是session,所以用cookie能够解决这个问题. 1.购物

不同浏览器的DNS超时重发机制(一)

一.Chrome浏览器(37.0.2062.124 m) 1.在Win7环境下,DNS超时重发的时间间隔为:2s.2s.2s.2s(在这个时刻重复发2个DNS请求).2s.4s,再经过大约14s左右,按上述时间间隔再重发一轮. 当DNS服务器有两个的时候,如下图: 二.Firefox浏览器(32.0.3.5379) 1.在Win7环境下,DNS超时重发的时间间隔是:2s.2s.4s. DNS服务器有两个的时候,如下: 2.Ubuntu-12.04环境下,DNS超时重发时间间隔为5s,重发16次.

解决SecureCRT连接linux超时后断开[转]

方法一: 从客户端入手 方法二: 从服务端入手 修改/etc/ssh/sshd_config配置文件 ClientAliveInterval 300(默认为0) 这个参数的是意思是每5分钟,服务器向客户端发一个消息,用于保持连接 service sshd reload 生效 解决SecureCRT连接linux超时后断开[转]

详解 Kubernetes Pod 的实现原理

Pod.Service.Volume 和 Namespace 是 Kubernetes 集群中四大基本对象,它们能够表示系统中部署的应用.工作负载.网络和磁盘资源,共同定义了集群的状态.Kubernetes 中很多其他的资源其实只对这些基本的对象进行了组合. Pod 是 Kubernetes 集群中能够被创建和管理的最小部署单元,想要彻底和完整的了解 Kubernetes 的实现原理,我们必须要清楚 Pod 的实现原理以及最佳实践. 在这里,我们将分两个部分对 Pod 进行解析,第一部分主要会从

Kubernetes Pod 控制器

在机器人技术和自动化中,控制环是一个控制系统状态的不终止的循环 这是一个控制环的例子:"房间里的温度自动调节器"当你设置了温度,告诉了温度自动调节器你的"期望状态",房间的实际温度是"当前状态".通过对设备的开关控制,温度自动调节器让其当前状态无限接近于期望状态.控制器通过 k8s的apiserver 去监控集群的公共状态,并致力于将当前状态转变为所期望的状态. 中文参考官方:怎么描述Kubernetes架构控制器的 kubernetes 之Po

Kubernetes系列之Kubernetes Pod控制器

#一.常见Pod控制器及含义 ###1. ReplicaSets ReplicaSet是下一代复本控制器.ReplicaSet和 Replication Controller之间的唯一区别是现在的选择器支持.Replication Controller只支持基于等式的selector(env=dev或environment!=qa),但ReplicaSet还支持新的,基于集合的selector(version in (v1.0, v2.0)或env notin (dev, qa)).大多数kub

kubernetes 中DNS的安装部署测试

[toc] 安装DNS后,pod就可以通过dns来解析service,从而实现通信 kubernetes 版本: kubectl version 我当前的版本是1.9.0 1.kubectl dns 的安装 1.1 在官网下载配置文件 https://github.com/kubernetes/kubernetes 具体路径是cluster/addons/dns/kube-dns 可能版本不一样,路径略有不同 该路径下有三个相似的配置文件: kube-dns.yaml.base kube-dns