🗃️ Kubernetes使用笔记
5 items
🗃️ Kubernetes扩展开发
4 items
🗃️ Kubernetes问题排查
2 items
📄️ Kubelet驱逐Pod详细流程
深入解析Kubernetes中kubelet的Pod驱逐机制,包括驱逐信号、阈值配置、QoS级别分类、驱逐优先级逻辑等。详细说明requests和limits配置对驱逐顺序的影响,以及内存、磁盘、PID等不同资源压力下的驱逐策略。结合源码分析驱逐流程的具体实现。
📄️ Kubernetes Device Plugin
本文详细介绍了Kubernetes中的Device Plugin机制,包括其工作原理和实现方法。通过Device Plugin,Kubernetes可以感知和管理GPU等特殊硬件资源,使容器能够像使用CPU和内存一样使用这些资源,特别适用于AI和高性能计算场景。
📄️ Kubernetes NetworkPolicy
详解Kubernetes NetworkPolicy的功能、配置方法、常见用法及业务场景实践。
📄️ Kubernetes RuntimeClass
深入解析Kubernetes RuntimeClass机制,介绍如何使用RuntimeClass为不同的Pod选择不同的容器运行时。详细讲解containerd、runc、Kata Containers、Firecracker等容器运行时的概念和关系,以及如何配置和使用RuntimeClass实现安全隔离和多租户场景。
📄️ Kubernetes PVC持久化存储
深入解析Kubernetes持久化存储机制PVC(PersistentVolumeClaim)和PV(PersistentVolume)的完整使用指南。详细讲解PVC的概念、生命周期、访问模式以及与Pod的关系。涵盖网络存储协议NFS、CIFS、iSCSI的配置方法和使用示例,展示如何在Kubernetes中挂载网盘。介绍StorageClass动态存储供应的实现原理和配置方案,提供Deployment和StatefulSet使用PVC的完整示例。适用于需要数据持久化、有状态应用部署的场景,助力实现灵活的存储管理和数据保护。
📄️ Kubernetes CPU&NUMA亲和性调度
深入解析Kubernetes中CPU和NUMA亲和性调度的完整实现方案。详细讲解Topology Manager、CPU Manager、Memory Manager和Device Manager四大核心组件的工作原理、配置方法和协同机制。涵盖kubelet完整配置示例、策略选项详解、NVIDIA GPU设备插件的NUMA感知功能、多种拓扑管理策略对比,以及实际测试案例和故障排查指南。适用于AI训练、推理等对CPU-GPU-内存局部性要求高的工作负载,助力性能优化和资源高效利用。