📄️ Volcano网络拓扑感知调度
深入介绍Volcano网络拓扑感知调度特性,包括HyperNode CRD定义、自动发现机制、调度策略以及在多机多卡AI训练场景中的实践应用,帮助优化InfiniBand和NVLINK等高性能网络环境下的任务调度效率。
📄️ Volcano网络拓扑感知调度测试
通过实际部署Kind集群、创建HyperNode、运行测试任务,真实验证Volcano网络拓扑感知调度能力。包含完整的环境搭建、配置示例、测试用例和结果分析,帮助理解和实践Volcano的网络拓扑调度特性。
📄️ Volcano网络拓扑感知调度案例
通过PD分离部署场景,详细演示如何使用Volcano网络拓扑感知调度功能,在IB网络环境下优化大模型推理服务的节点选择,降低网络延迟,提升带宽利用率。包含HyperNode配置、节点标签、Prefill和Decode服务部署的完整示例。