Skip to main content

背景

目前在推进关于智算加速卡的虚拟化建设,涉及到vGPUMPS/MIG的方案,在推进业务落地时,除了要考虑业务模型对加速卡使用率(平均/最大)、显存使用率(平均/最大)、业务的请求量,还需要充分考虑智算加速卡的成本。

常见智算加速卡

算力指标说明

算力单位

  • FLOPS:每秒浮点运算次数(Floating Point Operations Per Second
  • TFLOPS:万亿次浮点运算每秒(1 TFLOPS = 10¹² FLOPS),衡量GPU算力的标准单位

精度类型

  • FP64:双精度浮点,64位,主要用于科学计算和工程仿真
  • FP32:单精度浮点,32位,传统深度学习训练的标准精度
  • FP16:半精度浮点,16位,混合精度训练和推理加速
  • 带*号:表示使用Tensor Core加速的峰值性能

显存类型

  • HBM3e/HBM3/HBM2e/HBM2:高带宽内存,用于数据中心GPU
  • GDDR6X/GDDR6/GDDR5:图形DDR内存,用于消费级和工作站GPU

价格说明

  • 价格单位为万元人民币,为2024年市场参考价格
  • 实际价格因供应商、采购量、市场波动和地区差异而有所不同
  • 部分型号价格区间反映不同配置或市场渠道的差异
  • 国产芯片价格具有一定的政策优势和本土化服务成本优势

常见加速卡汇总

以下算力单位统一使用TFLOPS,价格统一使用万元人民币。

厂商卡型号名称FP64FP32FP16显存价格发售日期
NVIDIAM400.216.8-12GB/24GB GDDR51.5201511
NVIDIAP4-5.522*8GB GDDR51201609
NVIDIAP40-11.847*24GB GDDR52201609
NVIDIAV1007.815.7125*16GB/32GB HBM210201706
NVIDIAT4-8.165*16GB GDDR62.5201809
NVIDIARTX2080Ti-13.426.9*11GB GDDR61201809
NVIDIAA1009.719.5312*40GB/80GB HBM2e12202005
NVIDIARTX30900.636156*24GB GDDR6X1.5202009
NVIDIAA40-37.4149*48GB GDDR67202010
NVIDIAA30-10.3165*24GB HBM25202104
NVIDIAH10034671979*80GB HBM322202203
NVIDIARTX40901.383166*24GB GDDR6X1.4202210
NVIDIAA8009.719.5312*40GB/80GB HBM2e10202211
NVIDIAH8001671979*80GB HBM318202211
NVIDIAL4-30.3121*24GB GDDR64202303
NVIDIAL40-90.5362*48GB GDDR610202310
NVIDIAL40S-91.6733*48GB GDDR612202311
NVIDIARTX4090D1.173146*24GB GDDR6X1.2202312
NVIDIAH20--900*96GB HBM3102024Q1
NVIDIAH20034671979*141GB HBM3e282024Q2
华为昇腾910-32256*32GB HBM29201908
华为昇腾910B--376*64GB HBM312202401
海光DCU Z100-23.192.432GB HBM2e7202112
海光DCU K100-10020064GB HBM310202309
百度昆仑1-142816GB HBM24201912
百度昆仑2-3212832GB HBM2e7202108
寒武纪MLU370-2496*48GB LPDDR56202106
寒武纪MLU590-62.8314*80GB HBM312202406
壁仞BR100-4819264GB HBM2e10202212
沐曦MXC500-249632GB HBM2e5202306
燧原GCU S30-208032GB HBM2e5202201
天数智芯天垓100-3212832GB HBM2e6202301

参考资料

NVIDIA官方资料

技术对比与分析

国产智算加速卡资料

阿里平头哥相关资料

市场分析与趋势

华为昇腾资料


注:本文档数据基于公开资料整理,技术规格已通过官方资料验证。价格数据来源于2024年市场调研,以万元人民币为单位,实际采购价格可能因供应商、采购量、市场波动、地区差异等因素而有所不同。建议在实际采购前咨询最新报价。