创建部署问题时,请参考下面模板,你提供的信息越多,越容易及时获得解答。如果未按模板创建问题,管理员有权关闭问题。
确保帖子格式清晰易读,用 markdown code block 语法格式化代码块。
你只花一分钟创建的问题,不能指望别人花上半个小时给你解答。
操作系统信息
CentOS Linux 8
Kubernetes版本信息
Client Version: v1.24.3
Kustomize Version: v4.5.4
Server Version: v1.24.3
容器运行时
Version: 0.1.0
RuntimeName: containerd
RuntimeVersion: 1.6.7
RuntimeApiVersion: v1
KubeSphere版本信息
KK安装
kubesphere 3.3.2
问题是什么
整个多集群环境中有12个成员集群,所有集群的自建命名空间都一致,主集群与成员集群均有POD运行;
故障时间线:
2024-12-25 10:51 收到主集群节点负载过高告警消息;
2024-12-25 11:06 手动重启主集群;
2024-12-25 11:09 成员集群kube-apiserver日志打印命名空间删除资源请求;
2024-12-25 11:24 KubeSphere登入后项目列表发现两个自创建命名空间被删除,空间下所有资源被删除;
KubeSphere截图:
成员集群kube-apiserver日志:
主集群 kubefed组件
请帮忙分析定位具体原因,谢谢。
PS:因浏览社区故障帖子:https://kubesphere.io/zh/blogs/kubesphere-namespace-problem-solving-records/
内容有提到由于kubfed.io/managed: ’true’标签成员集群命名空间被删除,所以贴上kubefed-controller-manager故障时间点日志: