xingcheng 按照官方教程多节点安装,用了大概一个多月,集群所有节点资源占用都很正常,剩余不少,现在基本不能使用了,所有服务组件状态正常,已安装好的几个小应用也还在正常运行,jenkins也能正常使用, 但kubesphere登录进去后大部分页面刷不出来,或者反复刷新很久偶尔能刷出来 查看log也看不出什么问题,就是time out,但页面偶尔也能刷出来 一天比一天卡
RolandMa1986 xingcheng 清空redis 数据库试一下,3.0 版本中使用redis 作为前端session 数据缓存。有个key leak的问题。 $ kubectl -n kubesphere-system exec -it redis-<tab> redis-cli > flushdb > flushall
xingcheng RolandMa1986 请问会不会和这个报错有关 ks-console 一个pod重启次数很多,看ks-console 3个pod log,全是UnauthorizedError: Not Login报错:
hongming xingcheng 这个是探针触发的无用日志(3.1修复了), 你调整一下ks-apiserver的日志等级, 可以看到请求耗时, 看看可以稍微定位一下具体是慢在哪里,你贴出的这段日志有明显的请求超时
wanjunlei xingcheng 这个是审计的日志,你先把审计禁了试试 kubectl edit cm -n kubesphere-system kubesphere-config auditing: enable: false 把enable改成false,然后重启apiserver kubectl rollout restart deployment -n kubesphere-system ks-apiserver
xingcheng kube-system: 重启比较多的 kube-controller-manager-master1: 重启比较多的kube-scheduler-master1: 重启比较多的calico-node-thffx: