lingyun 创建部署问题时,请参考下面模板: 操作系统信息,例如:物理机,Centos7.6 aarch64 Kubernetes版本信息,例如:v17.9。单节点 KubeSphere版本信息,例如:v3.0.0。在线安装。添加集群节点。 之前单节点离线安装了kubesphere的v3.0.0 的arm版本,现在需要添加一个节点,执行 ./kk add nodes -f config-sample.yaml 命令之后卡住,问题如图,请问该如何定位,也没有报错日志
lingyun Cauchy 我刚单独执行了下initOS.sh脚本,卡住的位置和执行kk是一样的也没有报什么错误,是不是要在里面加些echo输出,还有一个问题,我之前脚本之后无法退出了,kill也无法杀掉进程,我看了下有两个进程在执行这个脚本,而且都无法杀掉,30520这个进程应该是上午执行kk的运行的,也无法杀掉
lingyun Cauchy 我在脚本里加了set -x 单独执行脚本,执行成功了,当我再次执行./kk add nodes -f config-sample.yaml 命令时,还是卡在了原来的位置。。
Cauchy https://github.com/kubesphere/kubekey/blob/fb0ad3ab9c613e8be318bd521c1d0ef2f48e1028/pkg/bootstrap/configuration/init_script.go#L119 我猜有可能是这条命令卡主了,可以自己修改下这个脚本,然后自行 build 一下 kk 执行试试,build方法可参考: https://github.com/kubesphere/kubekey/blob/master/docs/developer-guide.md#build-binary-from-source-code
lingyun lingyun ./kk version 找到了 ,谢谢 version.BuildInfo{Version:“latest+unreleased”, GitCommit:“443bbe8ac8ca1566b845ee24642fc16a6740fa4c”, GitTreeState:“dirty”, GoVersion:“go1.14.9”}
lingyun lingyun 已经解决了,是因为新增的节点使用的网卡不对,通过该命令来修改和绑定的网卡: kubectl set env daemonset.apps/calico-node -n calico-system IP_AUTODETECTION_METHOD=interface=ens.*