Hhuntunshule2020年5月7日发布 #8 2020年5月7日星期四 01点58分 hongming 解决了什么原因不太清楚,kubersphere用的这个kubesphere-kube-state-metrics clusterRole
frezesK零S2023年11月29日发布 #14 2023年11月29日星期三 02点33分 已编辑ulcadmin pod 监控没有数据检查下 kubelet的 cadvisor 指标暴露是否正常,可以将 Prometheus 对外暴露,查看下 Prometheus console 的 target 中是否有 unhealthy 的 target,可以尝试重启下对应节点 kubelet 试下
Uulcadmin2023年12月1日发布 #15 2023年12月1日星期五 02点24分 frezes 这个我暴露了 但是没找到你说的cadvisor指标,其他的都是正常的,没有unhealthy 的 target
Uulcadmin2023年12月1日发布 #21 2023年12月1日星期五 06点13分 frezes 那是有的 有很多 我ks界面上是有些pod有监控数据,大部分没 之前都是正常的,重启过机器后成这样了,但是节点监控是正常的
frezesK零S2023年12月1日发布 #22 2023年12月1日星期五 06点17分 ulcadmin 你看下没有Pod 监控的节点,将 node 过滤条件加上 node=“xxx”,是不是这些节点没有对应指标?
frezes ulcadmin pod 监控没有数据检查下 kubelet的 cadvisor 指标暴露是否正常,可以将 Prometheus 对外暴露,查看下 Prometheus console 的 target 中是否有 unhealthy 的 target,可以尝试重启下对应节点 kubelet 试下
frezes ulcadmin round(sum by (namespace, pod) (irate(container_cpu_usage_seconds_total{job="kubelet", pod!="", image!=""}[5m])) * on (namespace, pod) group_left(owner_kind, owner_name) kube_pod_owner{} * on (namespace, pod) group_left(node) kube_pod_info{namespace="xxxx",pod="XXX"}, 0.001) 将 namespace=“xxxx”,pod=“XXX” 替换为实际的 Pod 信息