hongming 我开启商店功能之后查看 pod job 都是成功的,但是访问应用商店页面的时候

发送 /kapis/openpitrix.io/v1/apps?xxx=xxx 请求返回 500,返回信息为
{
"message": "rpc error: code = Internal desc = internal error: rpc error: code = Unavailable desc = all SubConns are in TransientFailure, latest connection error: connection error: desc = \"transport: Error while dialing dial tcp 10.96.219.124:9118: i/o timeout\""
}

10.96.219.124:9118 对应的是 openpitrix-isv-manager 这个 service
已经重新执行过 job ,但是没有效果

这样问题应该如何去检查,我尝试过在console的容器中直接nc -zv 10.96.219.124 9118open的。

    brosoul 需要在 ks-apiserver 的pod 里检查一下 openpitrix-isv-manager.openpitrix-system.svc:9118 端口通不通,看看dns解析地址正不正确

      hongming

      / # nc -zv openpitrix-isv-manager.openpitrix-system.svc 9118
      openpitrix-isv-manager.openpitrix-system.svc (10.96.219.124:9118) open
      / # nslookup openpitrix-isv-manager.openpitrix-system.svc localhost
      Server:    127.0.0.1
      Address 1: 127.0.0.1 localhost
      
      Name:      openpitrix-isv-manager.openpitrix-system.svc
      Address 1: 10.96.219.124 openpitrix-isv-manager.openpitrix-system.svc.cluster.local

      在ks-apiserver的pod,端口时通的,解析的IP也是service中对应的 ClusterIP

      kubectl -n openpitrix-system get po 看看pod状态是否都正常呢

        对应的pod是正常的

        brosoul@sphere:~$ kubectl get pod -n openpitrix-system
        NAME                                                  READY   STATUS      RESTARTS   AGE
        hyperpitrix-release-app-job-nqrxl                     0/1     Completed   0          82m
        openpitrix-app-db-ctrl-job-dc8qc                      0/1     Completed   0          17h
        openpitrix-attachment-db-ctrl-job-zmv4z               0/1     Completed   0          17h
        openpitrix-cluster-db-ctrl-job-hzr9l                  0/1     Completed   0          17h
        openpitrix-db-init-job-d7hpf                          0/1     Completed   0          46m
        openpitrix-hyperpitrix-deployment-6bcdc4f78d-kcsrd    1/1     Running     1          17h
        openpitrix-isv-db-ctrl-job-v4fs6                      0/1     Completed   0          82m
        openpitrix-job-db-ctrl-job-lcdt4                      0/1     Completed   0          17h
        openpitrix-repo-db-ctrl-job-4c2rs                     0/1     Completed   0          17h
        openpitrix-rp-kubernetes-deployment-df978b847-xhhdr   1/1     Running     1          17h
        openpitrix-runtime-db-ctrl-job-k7lnf                  0/1     Completed   0          17h
        openpitrix-task-db-ctrl-job-9r2mt                     0/1     Completed   0          17h

        hongming

        这时候就要检查一下kubesphere-system/deployments/ks-apiserver 有几个副本呢 ,所有pod 到 openpitrix-isv-manager.openpitrix-system.svc:9118端口都是通的吗,如果还是无法定位到问题,可以邮件tv 或者向日葵到kubesphere@yunify.com 我们协助排查

          hongming ks-apiserver 这里只有一个副本,我测试了 kubesphere-system 下的pod (etcd、ks-account、ks-apigateway、ks-apiserver、ks-controller-manager、ks-installer、minio、redis)上都是通的。十分感谢您的耐心回答。协助排查需要怎样的流程吗

          18 天 后

          Q:openpitrix安装完成之后应用商店里边没看到应用
          A:openpitrix安装完成之后应用商店里边会显示出我们内置的应用,如果没有显示,通过kubectl get job -n openpitrix-system查看hyperpitrix-release-app-job
          如果COMPLETIONS列出现0/1表示该Job执行失败,通过下面命令重新执行.

          kubectl -n openpitrix-system get job hyperpitrix-release-app-job -o json | jq ‘del(.spec.selector)’ | jq ‘del(.spec.template.metadata.labels)’ | kubectl replace –force -f -
          补充,还可以参考这个 issue 解决应用商店里边没看到应用的问题。

            4 个月 后

            我遇到过这种问题,是因为:openpitrix数据库字段太短了,一个表的主键限制死是54个字符,但是生成的长度是55字符,造成job都成功但是往里面插入数据失败,改了长度就正常了。需要看下openpitrix里面的报错@hetao Feynman

              12 天 后

              vincentgao 具体什么现象?
              openpitrix-system下面的pod状态是ok的么?
              应用商店可不可以进?
              应用商店里边是否有应用