🗃️ Kubernetes使用笔记
5 items
🗃️ Kubernetes扩展开发
4 items
🗃️ Kubernetes问题排查
2 items
📄️ Kubelet驱逐Pod详细流程
深入解析Kubernetes中kubelet的Pod驱逐机制,包括驱逐信号、阈值配置、QoS级别分类、驱逐优先级逻辑等。详细说明requests和limits配置对驱逐顺序的影响,以及内存、磁盘、PID等不同资源压力下的驱逐策略。结合源码分析驱逐流程的具体实现。
📄️ Kubernetes Device Plugin
本文详细介绍了Kubernetes中的Device Plugin机制,包括其工作原理和实现方法。通过Device Plugin,Kubernetes可以感知和管理GPU等特殊硬件资源,使容器能够像使用CPU和内存一样使用这些资源,特别适用于AI和高性能计算场景。
📄️ Kubernetes NetworkPolicy
详解Kubernetes NetworkPolicy的功能、配置方法、常见用法及业务场景实践。
📄️ Kubernetes CPU&NUMA亲和性调度
深入解析Kubernetes中CPU和NUMA亲和性调度的完整实现方案。详细讲解Topology Manager、CPU Manager、Memory Manager和Device Manager四大核心组件的工作原理、配置方法和协同机制。涵盖kubelet完整配置示例、策略选项详解、NVIDIA GPU设备插件的NUMA感知功能、多种拓扑管理策略对比,以及实际测试案例和故障排查指南。适用于AI训练、推理等对CPU-GPU-内存局部性要求高的工作负载,助力性能优化和资源高效利用。