- 已编辑
kubectl rollout restart deploy ks-installer -n kubesphere-system
把 ks-installer 重启然后看看日志,看下执行过程
kubectl rollout restart deploy ks-installer -n kubesphere-system
把 ks-installer 重启然后看看日志,看下执行过程
真的很郁闷,同样的环境,3.1.1的工具中是没有问题的,升级到3.2.0各种问题,然后干脆卸载了3.2,重新安装,还是一样的。还有其它的问题,比如开启了auditing,pod "kube-auditing-webhook-deploy-xxxx"中也能看到auditing日志,但是es中就是生成不了index。这些小问题排查了好多天了,头痛,让我不敢轻易上生产。官方文档很简单,就是改几个参数,查都没法查。
morriszs 重新安装的集群仍然有问题吗?
你这个估计得找人远程看看,有买qingcloud 的服务么,在上面提个工单可以找人看看。
DehaoCheng
是的,仍然有问题,重装无数次了。各种日志翻遍了,找不到头绪。
morriszs 重新安装后具体是什么问题呢
审计日志的问题,可以看看这个
https://kubesphere.com.cn/forum/d/5971-v320/2
我的集群如下:
下面的参数也是在登陆host主集群的情况下打印出来的,我想参数应该也是host集群的,跟member集群没关系。
member集群目前用默认密码登陆不上,这又是另外一个悲伤的问题了:
后台报错:
DehaoCheng 不是docker环境啊,我的member集群的k8s版本是:v1.21.4,没有docker,用的containerd。这就是我为什么要升级到3.2.0版本的原因,因为它支持containerd的text日志格式和流水线。
morriszs 那containerruntime: docker就应该填containerd而不是docker啊。
DehaoCheng
初始安装时,我是改成了containerd,但ks-installer始终报错,一直安装不上,没办法才改成了默认的docker,这才安装上了。我翻看了官方的github,对这个containerruntime参数没有任何解释,也没提供任何可选参数,默认就是docker。
morriszs 那你改为containerd重新安装ks-installer呢?如果有什么报错请贴出来。
DehaoCheng
改成containerd以后,ks-installer日志没有报错:
PLAY RECAP *********************************************************************
localhost : ok=28 changed=17 unreachable=0 failed=0 skipped=11 rescued=0 ignored=0
Start installing monitoring
Start installing multicluster
Start installing openpitrix
Start installing network
Start installing alerting
Start installing auditing
Start installing devops
Start installing events
Start installing logging
Start installing servicemesh
Waiting for all tasks to be completed …
task openpitrix status is successful (⅒)
task alerting status is successful (2/10)
task network status is successful (3/10)
task multicluster status is successful (4/10)
task auditing status is successful (5/10)
task events status is successful (6/10)
task logging status is successful (7/10)
task servicemesh status is successful (8/10)
task devops status is successful (9/10)
task monitoring status is successful (10/10)
Collecting installation results …
#####################################################
#####################################################
但是,fluentbit报错了,跟以前一样:
morriszs 这个错误应该在于containerd的问题,找不到crictl,你可以执行
kubectl edit fluentbits.logging.kubesphere.io -n kubesphere-logging-system
添加containerLogRealPath即可
DehaoCheng
我用命令“kubectl edit fluentbits.logging.kubesphere.io -n kubesphere-logging-system”改成了如下图所示:
之前的crictl错误已经消失,但是很多fluentbit pod报缓存错误:
我将output配置文件tail相关的文件由默认的5M改为10M,内存错误消失。
再看fluentbit的日志时,发现出现了auditing日志。检查es index,成功生成。
审计日志生成问题已解决。
前端工具箱没有日志查询,日志审计这个问题依然存在。