按要求安装开通kubesphere-alertmanager之后,并配置好wechat告警,对于deployment实例有异常的,把实例数改为0之后,一直还存在告警,与原生的prometheus的altermanager的规则相差比较大。
比如以下告警,直接把实例数调为0了之后,还每天都在报,并且一天会收到几百条真实,虚假的告警信息,对于告警准确性还需有待提高。
比如:抑制告警,同类型告警输出,同类型告警延时一起输出等规则
环境: KUBESPHERE
🚒@总览
类型: ContainerFailed
级别: warning
租户: database-test
@告警
container: postgres10
pod: postgres10test-v1-0
标题: Container failed
详情: Error: ImagePullBackOff
时间: 2021-01-30 09:11:52
@告警
container: postgresql
pod: postgres1-test-postgresql-0
标题: Container failed
详情: Error: ImagePullBackOff
时间: 2021-01-30 09:11:52

此告警的pods早就不存在了,还一直在告警
环境: KUBESPHERE
🚒@总览
类型: ContainerFailed
级别: warning
租户: juslink-dev
@告警
container: milestone
pod: milestone-7bb59f7689-w4cqp
标题: Container failed
详情: Error: ImagePullBackOff
时间: 2021-01-30 09:17:53