xingxing122 我拉取了master 分支,打的镜像还是有问题,这个问题修复是在那个分支搞的

    • hongmingK零SK壹S

    • 已编辑

    xingxing122

    是 master 分支,这一行改动一目了然,只有 ClientConfig.Service 是指针类型

    你再检查一下 pod,看看 imagePullPolicy 改过了吗

      升级网关 failed to get API group resources: unable to retrieve the complete list of server APIs: gateway.kubesphere.io/v2alpha1: the server could not find the requested resource

        bwcx

        member 集群上的网关升级,要等集群污点移除后,Gateway 扩展组件调度成功之后再执行。

        • bwcx 回复了此帖

          bwcx

          host 集群上也要等待扩展组件调度,可以通过UI 检查一下网关扩展组件的调度状态,或者通过以下命令:

          kubectl get installplan gateway -o json | jq -r '["Cluster", "State"], (.status.clusterSchedulingStatuses | to_entries[] | [.key, .value.state]) | @tsv' | column -t
          • bwcx 回复了此帖

            hongming 改动了,我拉去master 分支自己在本地打了一个镜像

            • 已编辑

            hongming
            Cluster State
            host Installed

            gateway-agent-backend-controller-manager 日志

            • bwcx 回复了此帖
              • 已编辑

              bwcx 装好了,我把 WhizardTelemetry 监控安装好就安装成功了。不过安装 WhizardTelemetry 监控也报错了。把 kubesphere-monitoring-system 命名空间删除重新装才成功。
              然后网关页面报错

                bwcx

                网关升级失败了,CRD 没被更新,可能是这个问题 kubesphere/ks-upgrade#28

                可以检查一下 CRD 是否更新了

                kubectl get crd gateways.gateway.kubesphere.io -o yaml

                重新部署一下 Gateway 扩展组件,把 CRD 重新创建一遍,再来升级网关实例

                • bwcx 回复了此帖
                  • 已编辑

                  hongming 我把原来的crd删除重新安装的,不需要升级网关了吧。


                  应用路由这里显示好像有问题,实际访问是没有端口的。

                  hongming 我现在都不会升级了,接下来都不知道咋操作了。 这个问题搞的有点懵逼

                    • hongmingK零SK壹S

                    • 已编辑

                    xingxing122

                    还是检查 prepare upgrade pod 的日志,如果镜像正常更新了,就不可能继续在这一行空指针

                    重新执行升级脚本,检查日志,重新核对错误信息

                    panic: runtime error: invalid memory address or nil pointer dereference
                    
                    [signal SIGSEGV: segmentation violation code=0x1 addr=0x18 pc=0x2025ccf]
                    
                    goroutine 1 [running]:
                    
                    kubesphere.io/ks-upgrade/pkg/jobs/core.(\*upgradeJob).deleteKubeSphereWebhook(0xc000a2f630, {0x2ba2f40, 0x40e7c00})
                    
                    	/workspace/pkg/jobs/core/core.go:429 +0x22f
                    25 天 后

                    运行pre-check.sh。控制台输出如下。查看ks-install的pod,也是在running状态。可以正常升级吗?

                      升级过程分为以下三个主要步骤,请按照顺序执行:

                      1. 升级 host 集群并迁移扩展组件数据。

                      2. 升级 member 集群并迁移扩展组件数据。

                      3. 升级网关。

                      咨询一下,如果使用了其他的第三方网关,从3.4.0升级到v4.x不执行第3步。

                      大版本对网关有没有强依赖,升级会不会有影响?感谢。

                        masterYI 需要检查一下 ks-installler 的 job 执行到什么阶段了,如果是因为异常停止了,那就检查一下存储、计算资源够不够,升级前集群中的工作负载是否有异常,需要根据实际的状态调整整升级配置,升级前存在异常的组件可以选择不升级,或者手动恢复后再升级

                        bichord2025

                        对网关没有依赖,如果是你自己部署的网关,不受升级的影响,不需要执行网关升级这个步骤。你自己部署的网关,当作普通的工作负载进行管理就可以了。

                          升级到4.1.2之后,在的devops项目里,只有admin账户可以创建kubeconfig类型凭证,其他账户无论什么角色都无法创建。

                          凭证管理