WwanjunleiK零S
你看下ks-console的镜像版本
你看下ks-console的镜像版本
还有 ks-apiserver 的镜像版本
我看了,当前运行的容器,都是用的3.4.0的镜像拉起的
其实我们怀疑,是我们升级到3.4.0时,遗留了不知道什么问题导致的。我们当时升级时,就遇到了一堆杂七杂八的问题,虽然后面磕磕绊绊解决了 ,但是总感觉不太踏实的样子。 或许可以看看怎么能 全方位检查一下3.4.0是否升级有问题这方面入手
下班了,明天再继续分析下吧, 感谢支持
@“wanjunlei” 你好,我发现再页面上编辑【钉钉机器人】点击确认时, 控制台有个not found报错提示
说是找不到【default-dingtalk-config】,但是我用命令行查看配置,发现是有的
怎么从这方面入手分析呢
额,我又多试了几次,不稳定报错404。。。 有时候会报,有时候不会报
kubectl delete nc default-dingtalk-config
kubectl delete nr global-dingtalk-receiver
kubectl delete secret -n kubesphere-monitoring-federated global-dingtalk-config-secret
把钉钉的配置清理一下,然后重新设置
好的,我这边试一下
同时,我这边观察到一个现象,不知道和这个有没有关系(部分版本不一致notification.kubesphere.io/v2beta2 和notification.kubesphere.io/v2beta1同时存在了)
我记得钉钉的webhook机器人,需要设置关键字才能触发,如果没有关键字是触发不了的,关键字为告警内容里面含有任一内容即可,可以看看跟这个有没有关系
makamaka 关键字匹配有的。我们怀疑是升级到3.4.0时操作不当遗留下的问题,准备把测试环境重新直接3.4.0版本的kubesphere试试
JustryDeng 嗯,那可能是跟你的操作有关系,我的是3.3.2版本,告警这块儿没啥问题,升级没试过,不清楚是否会有影响
@“wanjunlei” 你好,请问我们在使用kk重新create kubesphere3.4.0时(./kk create cluster -f config.yaml -y),etcd证书校验失败,这个是因为什么啊
我们的kk配置文件是是这样的
/et/hosts是这样配置的
192.168.0.118 node118
192.168.0.119 node119
# kubekey hosts BEGIN
192.168.0.118 node118.cluster.local node118
192.168.0.119 node119.cluster.local node119
192.168.0.118 lb.kubesphere.local
我们发现证书绑定的ip地址是公网的ip地址了,如何让证书绑定内网的ip地址呢
借楼,想问一下楼主你是怎么删除notification manager然后升级的。查了一下需要删除相关的部署资源再安装,感觉要删除的资源实在是太多了。
kubectl delete -f notification-manager.yaml
em1是外网ip,我们把所有节点的外网ip关了,换了台机器kk create -f config.yaml重装kubesphere,同时在config.yaml中指定装etcd的节点也换了(因为关掉外网ip后,重新在原节点上装etcd,那个节点的证书对应的ip居然还是那个已关闭的外网ip……)
重装成功
成功后,再恢复的em1的外网ip
昨天重装3.4.0成功
今天下午再测试钉钉机器人预警,结果还是一样。。。。
只能等下个版本出来后,我们升级到下个版本,再看看还有没有这个问题了
你的这个版本为什么是v2beta1?
我也遇到同样的问题,kubesphere 3.4.0版本,请问楼主解决了吗?
doramingo 我们暂时直接去receiver里面改的 :