按照官方的指导文档,卸载了kubesphere自带的prometheus堆栈,然后安装了自己的prometheus,然后从grafana已经可以查看到各类指标数据,但是kubesphere系统界面中很多指标采集出现异常,请教一下是什么原因导致的。
pod情况如下图:
集成自己的Prometheus后Kubesphere指标数据采集问题
检查了一遍之后发现prometheus的rules没有配置,复制了kubesphere提供的rules.yaml到prometheus中加载,报错,报错信息以及现有服务如图
4 天 后
有人帮忙看下么?
- 已编辑
19848058668 你发的贴子是对的,把步骤三集成一下就可以了。
kubesphere的prometheus stack定制了一些自己的rule,包括告警和查询等,集成了,console才能查询这些预定义的rule,否则是不完整的。
19848058668 看你这个报错,应该是你自己的prometheus没有定义service,无法通过kapis转发请求。
zhu733756 意思是我应该在monitoring名空间下创建名为prometheus-kube-prometheus-operator的服务么?
19848058668 是的,你得先保证你得prometheus stack可用。
zhu733756 感谢支持,我们在新环境中尝试能成功了,后期在重装了K8S之后问题解决了,可能是K8S的某个配置错误导致的,现在数据展示正常了,有一个小问题, CPU的使用率经常会出现很大数字的情况,请问这种是正常的吗?
19848058668 不正常,你们自定义得cpu promql可能有点问题。