📄️ RDMA技术架构深度解析
全面深入地介绍RDMA(Remote Direct Memory Access)技术原理、架构实现和应用场景。详细解析InfiniBand、RoCE、iWARP三种主要RDMA实现方案,探讨CPU Offload、Kernel Bypass、Zero Copy等关键特性如何实现超低延迟和高带宽的网络通信,广泛应用于高性能计算、深度学习训练和数据中心网络优化
📄️ RDMA: InfiniBand vs RoCE
深入对比InfiniBand与RoCE v2两种主流RDMA网络解决方案的技术特性、性能表现和应用场景。详细解析InfiniBand的子网管理器机制、信用流控、自适应路由等核心特性,以及RoCE v2基于以太网的分布式架构、PFC/ECN流控配置。对比两者在业务性能、扩展规模、运维管理和成本方面的差异,为AI训练集群和数据中心网络选型提供决策参考
📄️ RDMA硬件管理及网络拓扑信息查看
全面介绍RDMA硬件管理和网络拓扑信息查看方法,详细讲解ibv_devinfo、ibnetdiscover、lldpctl等关键管理工具的使用。涵盖InfiniBand和RoCE两种RDMA实现方案的PCI设备识别、NFD标签、RDMA设备信息获取以及网络拓扑发现,为RDMA网络运维和故障诊断提供实用指南