kubesphere节点重启之后提示暂时没有监控数据?每次服务器下电之后再上电都会出现这种问题,所有节点全部显示暂时没有监控数据,一个一个重启节点服务器上的kubelet和docker服务之后,
可能会加载出来监控数据也可能一直重启都没反应,不知道怎么下手,有大佬给个操作指导吗
看了看没有监控数据的节点上,node-exporter日志提示

time="2021-03-22T03:34:49Z" level=error msg="ERROR: diskstats collector failed after 0.000156s: invalid line for /host/proc/diskstats for dm-2" source="collector.go:132"
time="2021-03-22T03:35:49Z" level=error msg="ERROR: diskstats collector failed after 0.000217s: invalid line for /host/proc/diskstats for sr0" source="collector.go:132"
time="2021-03-22T03:36:49Z" level=error msg="ERROR: diskstats collector failed after 0.000199s: invalid line for /host/proc/diskstats for sr0" source="collector.go:132"
time="2021-03-22T03:37:49Z" level=error msg="ERROR: diskstats collector failed after 0.000109s: invalid line for /host/proc/diskstats for sr0" source="collector.go:132"

但是发现能看到监控数据的节点上也有这个错误日志

2 个月 后

集群刚创建、节点刚加入集群等是会这样的,监控都会有1分钟左右的时间延迟,因为metric启动、数据采集、数据聚合等都要时间,可以看监控等组件日志

hahahaha 感觉没有 只要启动之后没监控 之后就一直没有 多次重启可能会恢复也可能还是没有监控数据~~

    5 个月 后
    1 年 后

    wangzq96
    可以另外开个新帖描述一下遇到的问题,可能同样的现象原因不同。
    这里可以提供一个简要的排查思路:

    1. 打开 Kubesphere 集群概览页面,看看哪些指标项没有就绪,都没有或者Node级别的没有,Pod 级别的没有?
    2. 通过概览大致定位是Prometheus 有问题?node-exporter有问题? kubelet/kube-state-metric收集的数据有问题?
    3. 然后查看对应的日志来分析问题,如果解决不了,可以将问题描述清楚,贴上日志开新帖或issue 进行讨论。
    1 年 后