• 安装部署
  • 集群节点增加cpu资源 导致大量组件错误

集群在本地安装使用contos7系统

问题出现在

项目部署之后发现节点的cpu用量高

其主要原因是kubesphere安装使用的组件yaml文件中书写的requests资源占用了较多的cpu资源

在为cpu资源扩充之后重启节点 出现了大量组件的错误

这是因为cpu资源分配之后组件会重新分配资源么

而重新分配资源重启pod的过程中 因为官方社区提供的安装脚本中 存在部分提供的镜像和组件使用yaml文件中的image不匹配的情况 所有大量组件无法正常启动

因为无法处理这一问题 我们对集群进行了恢复快照的操作

在每次操作之后会出现部分pod无法重新启动的情况 多数情况是istol的jaeger-query

同时通过快照回复之后

这三个pod多会长时间处于ContainerCreating状态

有类似于未授权的问题