创建部署问题时,请参考下面模板,你提供的信息越多,越容易及时获得解答。如果未按模板创建问题,管理员有权关闭问题。
确保帖子格式清晰易读,用 markdown code block 语法格式化代码块。
你只花一分钟创建的问题,不能指望别人花上半个小时给你解答。
操作系统信息
虚拟机,Centos7.6,4C/8G
Kubernetes版本信息
将 kubectl version
命令执行结果贴在下方
Client Version: version.Info{Major:“1”, Minor:“22”, GitVersion:“v1.22.10”, GitCommit:“eae22ba6238096f5dec1ceb62766e97783f0ba2f”, GitTreeState:“clean”, BuildDate:“2022-05-24T12:56:35Z”, GoVersion:“go1.16.15”, Compiler:“gc”, Platform:“linux/amd64”}
Server Version: version.Info{Major:“1”, Minor:“22”, GitVersion:“v1.22.10”, GitCommit:“eae22ba6238096f5dec1ceb62766e97783f0ba2f”, GitTreeState:“clean”, BuildDate:“2022-05-24T12:50:52Z”, GoVersion:“go1.16.15”, Compiler:“gc”, Platform:“linux/amd64”}
容器运行时
将 docker version
/ crictl version
/ nerdctl version
结果贴在下方
Version: 20.10.8
KubeSphere版本信息
KKv2.2.2 KSv3.3.0。使用KK在线AllinOne同时在线安装安装k8s和ks后,使用KK离线安装私有镜像仓库,使用kk离线安装拓展多节点。
问题是什么
1.拓展多节点后,新节点均卡在ContainerCreating,查看日志镜像拉取均为:image: ‘registry.cn-beijing.aliyuncs.com/kubesphereio/xxx’,导致镜像拉取失败;
2.拓展了新的master节点后,部署的ks-console,ks-apiserver,ks-controller pod也是用的是在线镜像域名,

修改ks-installer.yaml文件后无效,仍然自动使用在线域名镜像重新发布

3.手动修改ks-console,ks-apiserver,ks-controller 镜像地址发布成功后,ks系统开始变得不稳定,系统资源充足,但集群管理一直卡顿,转圈
使用如下方式修改网络配置后仍然无效,ks-apiserver缩减为单实例后问题消失。
net.ipv4.tcp_tw_recycle 影响了容器网络
echo “net.ipv4.tcp_tw_recycle = 0” >> /etc/sysctl.conf
sysctl -p