kubectl rollout restart deploy ks-installer -n kubesphere-system
把 ks-installer 重启然后看看日志,看下执行过程

真的很郁闷,同样的环境,3.1.1的工具中是没有问题的,升级到3.2.0各种问题,然后干脆卸载了3.2,重新安装,还是一样的。还有其它的问题,比如开启了auditing,pod "kube-auditing-webhook-deploy-xxxx"中也能看到auditing日志,但是es中就是生成不了index。这些小问题排查了好多天了,头痛,让我不敢轻易上生产。官方文档很简单,就是改几个参数,查都没法查。

    你这个估计得找人远程看看,有买qingcloud 的服务么,在上面提个工单可以找人看看。

    ruiyaoOps
    真的很感谢各位热心帮忙debug!
    我看到论坛有人说filter红框处要改为message,然后重启ks-apiserver,这些我都试过了,没用。

    我是准备把ks作为一个一站式解决方案的,包括日志、审计、istio、devops等,但目前遇到头痛的问题实在太多。

      morriszs 你清除下浏览器缓存,再试试F12打印下这个globals.ksConfig,截个这样的图:

      morriszs 你这个不用修改,因为你目前就是docker环境,而且pod都是正常运行的。这应该是前端显示问题。@weili520 可以帮你看看

        我的集群如下:

        下面的参数也是在登陆host主集群的情况下打印出来的,我想参数应该也是host集群的,跟member集群没关系。

        member集群目前用默认密码登陆不上,这又是另外一个悲伤的问题了:

        后台报错:

        DehaoCheng 不是docker环境啊,我的member集群的k8s版本是:v1.21.4,没有docker,用的containerd。这就是我为什么要升级到3.2.0版本的原因,因为它支持containerd的text日志格式和流水线。

          DehaoCheng
          初始安装时,我是改成了containerd,但ks-installer始终报错,一直安装不上,没办法才改成了默认的docker,这才安装上了。我翻看了官方的github,对这个containerruntime参数没有任何解释,也没提供任何可选参数,默认就是docker。

            DehaoCheng
            改成containerd以后,ks-installer日志没有报错:

            PLAY RECAP *********************************************************************
            localhost : ok=28 changed=17 unreachable=0 failed=0 skipped=11 rescued=0 ignored=0

            Start installing monitoring
            Start installing multicluster
            Start installing openpitrix
            Start installing network
            Start installing alerting
            Start installing auditing
            Start installing devops
            Start installing events
            Start installing logging
            Start installing servicemesh


            Waiting for all tasks to be completed …
            task openpitrix status is successful (⅒)
            task alerting status is successful (2/10)
            task network status is successful (3/10)
            task multicluster status is successful (4/10)
            task auditing status is successful (5/10)
            task events status is successful (6/10)
            task logging status is successful (7/10)
            task servicemesh status is successful (8/10)
            task devops status is successful (9/10)
            task monitoring status is successful (10/10)


            Collecting installation results …
            #####################################################

            Welcome to KubeSphere!

            #####################################################
            但是,fluentbit报错了,跟以前一样:

              morriszs 这个错误应该在于containerd的问题,找不到crictl,你可以执行

              kubectl edit fluentbits.logging.kubesphere.io  -n kubesphere-logging-system

              添加containerLogRealPath即可

                DehaoCheng
                我用命令“kubectl edit fluentbits.logging.kubesphere.io -n kubesphere-logging-system”改成了如下图所示:

                之前的crictl错误已经消失,但是很多fluentbit pod报缓存错误:

                我将output配置文件tail相关的文件由默认的5M改为10M,内存错误消失。
                再看fluentbit的日志时,发现出现了auditing日志。检查es index,成功生成。

                审计日志生成问题已解决。
                前端工具箱没有日志查询,日志审计这个问题依然存在。

                  morriszs 先清除浏览器缓存,再登录30880这个的管理界面,再次请求这个30880端口的:/kapis/config.kubesphere.io/v1alpha2/configs/configz

                  其次同样再控制台打印,globals.ksConfig,看两者是否一致。

                  昨天看你发的请求url截图中是请求的本地的地址,你是在本地运行了嘛