📄️ vGPU方案调研
深入调研业界主流vGPU方案,包括NVIDIA MPS/MIG、HAMi、NexusGPU、阿里云cGPU、腾讯云qGPU等,对比分析用户态和内核态API劫持方案的优劣,着重介绍HAMi开源项目的实现原理和关键组件。
📄️ HAMi vGPU调研
HAMi是CNCF沙箱项目,提供Kubernetes环境下的GPU虚拟化解决方案。通过CUDA API劫持实现硬显存隔离和算力配额管理,支持多GPU厂商,零侵入应用,是目前最成熟的开源vGPU方案之一。
📄️ HAMi Volcano安装测试
📄️ HAMi CUDA Driver API
深入解析HAMi Core通过LD_PRELOAD机制劫持的198个CUDA Driver API,涵盖设备管理、显存分配、内核启动、CUDA Graph等15个分类。详细说明20个核心劫持API如何实现显存配额检查和算力限制控制,以及178个透传API的作用。