背景: ASR 人工智能语音识别场景
工作负载创建的时候request一般启动给配置都比较低, 在没有请求的时候, CPU占用非常低, 1c左右, 但是有用户请求的时候, 由于是计算密集型的, 可能占用到15-20c, 而且ASR模型都比较大, 跑起来占用20-60G内存, 所以优先cpu占用, 到一定限度之后, 才允许起副本, 否则比较浪费内存
最佳扩容场景: 先按照cpu进行扩容, 我们默认给request 2c, 等负载占用到10c的时候, 才允许多起副本.
改进意见: 允许targetCPUUtilizationPercentage配置超过100%, 实际上我们现在使用的就是500%, 然而kubesphere界面不支持, api是支持的. 我们是直接用kubectl进行修改hpa满足现有场景的. 希望产品考虑一下该需求的合理性.