无法使用tracing 功能

YLhuangtaiming

部署的bookinfo一直好好的，最近上线想看一看，突然就在要算右上角报错
以下
Internal Server Error
rpc error: code = Unavailable desc = all SubConns are in TransientFailure, latest connection error: connection error: desc = “transport: Error while dialing dial tcp: lookup hyperpitrix.openpitrix-system.svc on 10.1.0.10:53: no such host”。
能正常访问和查看流量治理但是无法查看traching

使用管理员账号以后看到这里错了

master也报错了

master 报错 PLEG is not healthy: pleg was last seen active 4m0.168077972s ago; threshold is 3m0s
但是master这个一会就好了
而node2 节点报错一直存在
其报错信息为
container runtime is down, PLEG is not healthy: pleg was last seen active 9h33m34.878703449s ago; threshold is 3m0s, Container runtime not ready: RuntimeReady=false reason😃ockerDaemonNotReady message:docker: failed to get docker version: Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?]
有没有大佬帮助一下快交论文了，等着截图呢，心态崩溃了

有人吗，应用商城里的东西也没了救救孩子

Jeff

YLhuangtaiming 重启下master node2上的docker吧

hongming

YLhuangtaiming

先检查一下你的节点状态，恢复所有异常的节点，不知道怎么排查就重启吧
检查看有没有异常的 pod
尽可能的提供更多的日志、截图错误信息

从目前贴出的日志上看，是节点上的 docker daemon 挂了

YLhuangtaiming

Jeff 我试了很多次都没有用启动docker都没有报错，

YLhuangtaiming

Jeff 而且当我试图查看 docker的版本是好像就不行了
我也修改过daemon.json中的内容

Jeff

YLhuangtaiming 你的docker挂了，你排查下，说不定为你的论文擦出新的火花

YLhuangtaiming

Jeff 啥意思？主要是没时间了明天交论文

YLhuangtaiming

Jeff 重启Docker也不报错

YLhuangtaiming

Jeff 挂了是什么意思，我看见能在运行啊

YLhuangtaiming

hongming

节点 node2 一直是not ready
然后在node2上get pod时就出现上图中的错误

YLhuangtaiming

hongming
这又是什么原因

Cauchy

可以先 systemctl stop docker 关掉docker，然后再 systemctl start docker 启动docker试下。

如果还不行就 systemctl --force --force reboot 或者重启机器试试吧。

YLhuangtaiming

Cauchy Warning: Stopping docker.service, but it can still be activated by:
docker.socket还是不行，只能重启机器了吗

zackzhang

在master上执行：

Kubectl delete nodes node2

在node2上执行：

kubeadm reset # 在节点执行初始化

在master上执行：

$ kubeadm token create --print-join-command #然后把节点重新加入一次后恢复正常
...
kubeadm join 192.168.0.11:6443 --token 1z4n33.xqxdz6rig7nq6gei     --discovery-token-ca-cert-hash sha256:9e96f13fe91475c8e95e28ee26eda4b5429015c185fa8ea4a3642ebc9541250f

上面会打印加入集群的方法

在node2上执行重新加入。

YLhuangtaiming

zackzhang
这样会不会出问题，这平台还有其他人也在用

YLhuangtaiming

zackzhang
好像又出新问题了
kubeadm join 172.23.253.31:6443 –token 6srjzl.e0ozgox6dia6498u –discovery-token-ca-cert-hash sha256:36516175c096cbd6f93719bb2aeb44f43223decc754a4dce02624eb42bf5ee41

现在怎么办，大佬

YLhuangtaiming

zackzhang
大佬在吗

YLhuangtaiming

救救孩子吧，搞了一天了快

YLhuangtaiming

可以有大佬远程弄一下吗

Feynman

YLhuangtaiming 社区不支持一对一远程，只支持论坛和 Github issue 异步交流。如果你有紧急的问题可以在 kubesphere.cloud 提工单。