benjaminhuoK零S
看下其他 loki pod 的日志, loki 安装配置可能有问题
看下其他 loki pod 的日志, loki 安装配置可能有问题
你 telnet 一下 loki gateway 的 ip 和 port 看看是否能访问,看下 gateway 的日志
KubeSphere 开源版集成的能力:
argocd
jenkins
grafana
prometheus & alertmanager & notification-manager
harbor
jaeger
nacos
kubesphere 企业版集成的能力:
增强的 基于 Thanos 的多集群监控告警
KubeSphere v3.3 已经升级 KubeEdge 到 v1.9.2
edge-watcher 已经在 KubeSphere v3.3 替换为 KubeEdge 官方的 iptablemanager,edge-watcher 后面不再维护
建议升级到 KubeSphere v3.3+, 企业用户不方便升级的话可以提供 edge-watcher arm 镜像
隔离边缘节点要利用多集群
这一步是不需要的, @willqy 你把这段删掉吧
kubectl -n kubesphere-monitoring-system delete pods --all
这个可以去 KubeEdge 社区提问
据 KubeEdge 官方的说法,一个集群可以纳管 1000 左右的边缘 KubeEdge 节点。
也可以划分多个云端集群 通过 KubeSphere 多集群管理 每个云端集群纳管一部分边缘节点
happywzy 加上了 markdown 的通知模板可以贡献给社区
你重新build 是为了加什么功能吗?
你的提议和 kubesphere 现有租户模型冲突,现有的租户模型默认就不是按节点划分的,是按ns 组织起来的ws 划分。
节点隔离租户的方式会有一些实际的问题,比如涉及到工作负载的调度,怎么知道这个租户有权限调度到哪些节点等等问题
3.1 会在UI 上和 Notification Manager 的各个通知渠道有更好的集成
另外也可以尝试 Notification Manager v1.0.0-rc.0, 和之前版本有比较大的变化
https://github.com/kubesphere/notification-manager
kubesphere 的 Prometheus 是被 Prometheus operator 管理的,你只能通过修改 Prometheus crd 来实现更改配置
kubectl -n kubesphere-monitoring-system edit prometheus k8s
v0.3.0 已经支持parser 你可以在主页搜一下parser
删除前者 kubectl delete ns kubesphere-alerting-system
你的 kube-state-metrics 无权访问一些资源,你是做了什么操作了?
你可能需要重新apply下面的 yaml, 然后把 kube-state-metrics 的 pod 删掉
https://raw.githubusercontent.com/kubesphere/prometheus-operator/ks-v2.1.1/contrib/kube-prometheus/manifests/kube-state-metrics-clusterRole.yaml
https://raw.githubusercontent.com/kubesphere/prometheus-operator/ks-v2.1.1/contrib/kube-prometheus/manifests/kube-state-metrics-clusterRoleBinding.yaml
https://raw.githubusercontent.com/kubesphere/prometheus-operator/ks-v2.1.1/contrib/kube-prometheus/manifests/kube-state-metrics-role.yaml
https://raw.githubusercontent.com/kubesphere/prometheus-operator/ks-v2.1.1/contrib/kube-prometheus/manifests/kube-state-metrics-roleBinding.yaml
https://raw.githubusercontent.com/kubesphere/prometheus-operator/ks-v2.1.1/contrib/kube-prometheus/manifests/kube-state-metrics-serviceAccount.yaml
zhu733756 监视
监控
负责云原生 AI 相关产品及功能的开发工作。需要跟踪 K8s 生态圈上游开源的 AI 项目(比如 Kubeflow 等)进展并积极参与上游项目,进而将其产品化。积极参与开源边缘计算项目,设计及开发边缘 AI 产品。。
熟练掌握 Go 语言,具备 Python 等其他一种或多种语言的开发经验
熟悉 Kubernetes,了解源码和实现者优先
熟悉机器学习和深度学习相关理论与技术,有相关项目经验者优先
熟悉云原生 AI 领域开源项目如 Kubeflow,有相关项目代码贡献者优先
对云原生边缘计算感兴趣,熟悉相关开源项目
较强的团队沟通和协作能力,较强的独立开发能力和自我驱动能力。
可配置的都在这
https://github.com/kubesphere/kubekey/blob/master/docs/config-example.md