YLhuangtaiming 部署的bookinfo一直好好的,最近上线想看一看,突然就在要算右上角报错 以下 Internal Server Error rpc error: code = Unavailable desc = all SubConns are in TransientFailure, latest connection error: connection error: desc = “transport: Error while dialing dial tcp: lookup hyperpitrix.openpitrix-system.svc on 10.1.0.10:53: no such host”。 能正常访问和查看流量治理但是无法查看traching 使用管理员账号以后看到这里错了 master也报错了 master 报错 PLEG is not healthy: pleg was last seen active 4m0.168077972s ago; threshold is 3m0s 但是master这个一会就好了 而node2 节点报错一直存在 其报错信息为 container runtime is down, PLEG is not healthy: pleg was last seen active 9h33m34.878703449s ago; threshold is 3m0s, Container runtime not ready: RuntimeReady=false reason😃ockerDaemonNotReady message:docker: failed to get docker version: Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?] 有没有大佬帮助一下 快交论文了,等着截图呢,心态崩溃了 有人吗,应用商城里的东西也没了 救救孩子
hongming YLhuangtaiming 先检查一下你的节点状态,恢复所有异常的节点, 不知道怎么排查就重启吧 检查看有没有异常的 pod 尽可能的提供更多的日志、截图错误信息 从目前贴出的日志上看,是节点上的 docker daemon 挂了
Cauchy 可以先 systemctl stop docker 关掉docker,然后再 systemctl start docker 启动docker试下。 如果还不行就 systemctl --force --force reboot 或者重启机器试试吧。
YLhuangtaiming Cauchy Warning: Stopping docker.service, but it can still be activated by: docker.socket还是不行,只能重启机器了吗
zackzhang 在master上执行: Kubectl delete nodes node2 在node2上执行: kubeadm reset # 在节点执行初始化 在master上执行: $ kubeadm token create --print-join-command #然后把节点重新加入一次后恢复正常 ... kubeadm join 192.168.0.11:6443 --token 1z4n33.xqxdz6rig7nq6gei --discovery-token-ca-cert-hash sha256:9e96f13fe91475c8e95e28ee26eda4b5429015c185fa8ea4a3642ebc9541250f 上面会打印加入集群的方法 在node2上执行重新加入。
YLhuangtaiming zackzhang 好像又出新问题了 kubeadm join 172.23.253.31:6443 –token 6srjzl.e0ozgox6dia6498u –discovery-token-ca-cert-hash sha256:36516175c096cbd6f93719bb2aeb44f43223decc754a4dce02624eb42bf5ee41 现在怎么办,大佬