测试 TIDB in k8s 一次问题记录(pd failed to respond)

原创
01/25 00:00
阅读数 9

作者: WalterWj 原文来源:https://tidb.net/blog/ebea9a8e

问题背景

单机装了个 k8s,TIDB 部署启动的时候看报错好像是 tikv 访问不到 pd。

img_v3_027e_e3521cfb-8bc1-4d52-9063-5dcd0856aefg.jpg

但是通过 tikv pod curl pd 端口是通的(404 代表通,但是 API 不存在)。

而且可以看到本地目录 pd 是预期产生文件了的。登录 pd pod,执行 pd-ctl 也是正常执行。member 命令下有内容

image.png

解决方法

这个时候已经到了问题瓶颈,因为手动调试网络通的,但是 tikv 确实访问不到 🤔。后来内部请教了下研发,原来我不是第一个遇到这个问题的。

相关 ISSUE:https://github.com/pingcap/tidb-operator/issues/5372#issuecomment-1794020036

按照相关 ISSUE 配置后:

img_v3_027e_5698ab32-ab2e-4d5c-8471-e1ec502b044g.jpg

看起来 tikv 预期创建文件。kubectl logs 查看 tikv pod 也是预期解决。

搜索了下 GRPC_DNS_RESOLVER native 原理,看到 gRpc 有相关 ISSUE,感觉是 gRpc 的问题 🤔

ISSUE:https://github.com/grpc/grpc/issues/18691

这个问题解决了很久,Google 半天居然没有找到解决方案,这里分享下。(头皮发麻)

这里感谢下贵司研发 笔芯。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部