morriszs kubesphere多集群模式,触发内置告警时,收到的告警信息如下: 1 alert for alertname=KubePodNotReady namespace=ingress-nginx Alerts Firing: Labels: alertname = KubePodNotReady - cluster = default namespace = ingress-nginx pod = busybox-b6f6d4668-l4kcd prometheus = kubesphere-monitoring-system/k8s severity = warning Annotations: message = Pod ingress-nginx/busybox-b6f6d4668-l4kcd has been in a non-ready state for longer than 1 minutes. 请问,如何修改- cluster = default,多集群模式下无法区分告警来自哪个集群。 可以在CRD中添加自定义的label来区分集群,但内置告警有几十个,不可能每个集群所有告警都手动添加label来区分,这样治标不治本。 想知道在哪里可以修改或者说配置cluster名称,来正确显示对应的集群名称。
morriszs wanjunlei 😄 非常感谢!有用,解决我的大问题了。 另外我想问一下,可以在告警中加上触发时间吗?没有时间字段这个实在不方便,而且有些是历史告警。 可以在labels中加什么date之类的字段吗?
wanjunlei alertmanager会对告警进行合并,重复的告警不会频繁发送,加上时间字段后同一告警规则产生的告警会被认为是两条不同的告警,导致告警消息频繁发送。 你可以认为收到告警的时间就是触发的时间