• 安装部署
  • kubesphere 4.1 安装完成以后创建工作负载,填写GPU限制不生效

创建部署问题时,请参考下面模板,你提供的信息越多,越容易及时获得解答。如果未按模板创建问题,管理员有权关闭问题。
确保帖子格式清晰易读,用 markdown code block 语法格式化代码块。
你只花一分钟创建的问题,不能指望别人花上半个小时给你解答。

操作系统信息
Ubuntu22.04

Kubernetes版本信息
Client Version: v1.28.15

Kustomize Version: v5.0.4-0.20230601165947-6ce0bf390ce3

Server Version: v1.28.15

容器运行时
docker version / crictl version / nerdctl version 结果贴在下方

root@ds-master01:~# crictl version

Version: 0.1.0

RuntimeName: containerd

RuntimeVersion: 1.7.25

RuntimeApiVersion: v1

KubeSphere版本信息
例如:v2.1.1/v3.0.0。离线安装还是在线安装。在已有K8s上安装还是使用kk安装。

v4.1.2,在线安装,在已经有k8s上安装

问题是什么
部署方式:

  k8s(v1.28) + GPU Operator + kubespshere(v4.1.2) 部署

问题:

部署完成以后创建工作负载后选择gpu限制为1,创建容器以后进入容器nvidia-smi查看挂载的GPU卡数量为物理机上所有的GPU;

    • frezesK零S

      lytos666

      该问题时一个前端已知的小 bug,填写GPU限制不生效,当前您可以通过编辑 yaml 字段的方式就行配置, 下个版本会进行修复。

      另外,你可以查看扩展组件 Whizard 监控 的 Readme,修改配置可启用 nvidia GPU 监控。

        frezes
        预计什么时候回更新呀,这种每次都要改很麻烦

        frezes
        或者有什么别的方式修改这个前端,不需要每次创建工作负载都去修改yml文件

          • frezesK零S

            lytos666

            cherry-pick 下修复 PR,自行构建下前端镜像进行更新替换?