📄️ 混合调度的亲和性、污点容忍设计思考
深入探讨AI算力场景下的混合调度设计思路,详细介绍基于Kubernetes的节点标签和污点设计方案,通过节点亲和性和污点容忍机制实现训练、推理、混部场景的智能调度策略,提供完整的Volcano Job和Deployment配置示例
📄️ 混部调度中如何控制在线服务的缩容逻辑
深入分析Kubernetes缩容机制的源码实现,详细解读Pod删除排序规则和pod-deletion-cost注解的工作原理。提供手动设置和自动化Controller两种方案,精确控制混部调度场景下在线推理服务的缩容逻辑,优先缩容混部资源池中的Pod,保留推理资源池中的Pod,确保服务稳定性