Skip to main content

背景

目前在推进关于智算加速卡的虚拟化建设,涉及到vGPUMPS/MIG的方案,在推进业务落地时,除了要考虑业务模型对加速卡使用率(平均/最大)、显存使用率(平均/最大)、业务的请求量,还需要充分考虑智算加速卡的成本。

常见智算加速卡

数据来源

https://www.techpowerup.com/gpu-specs/

算力指标说明

算力单位

  • FLOPS:每秒浮点运算次数(Floating Point Operations Per Second
  • TFLOPS:万亿次浮点运算每秒(1 TFLOPS = 10¹² FLOPS),衡量GPU算力的标准单位

精度类型

  • FP64:双精度浮点,64位,主要用于科学计算和工程仿真
  • FP32:单精度浮点,32位,传统深度学习训练的标准精度(通常使用这个)
  • FP16:半精度浮点,16位,混合精度训练和推理加速
  • 带*号:表示使用Tensor Core加速的峰值性能

显存类型

  • HBM3e/HBM3/HBM2e/HBM2:高带宽内存,用于数据中心GPU
  • GDDR6X/GDDR6/GDDR5:图形DDR内存,用于消费级和工作站GPU

价格说明

  • 价格单位为万元人民币,为2024年市场参考价格
  • 实际价格因供应商、采购量、市场波动和地区差异而有所不同
  • 部分型号价格区间反映不同配置或市场渠道的差异
  • 国产芯片价格具有一定的政策优势和本土化服务成本优势

常见加速卡汇总

以下算力单位统一使用TFLOPS,价格统一使用万元人民币。

厂商卡型号名称FP16FP32FP64显存价格发售日期
NVIDIAM40-6.80.2112GB/24GB GDDR51.5201511
NVIDIAP422*5.5-8GB GDDR51201609
NVIDIAP4047*11.8-24GB GDDR52201609
NVIDIAV100125*15.77.816GB/32GB HBM210201706
NVIDIAT465*8.1-16GB GDDR62.5201809
NVIDIARTX2080Ti26.9*13.4-11GB GDDR61201809
NVIDIAA100312*19.59.740GB/80GB HBM2e12202005
NVIDIARTX3090156*360.624GB GDDR6X1.5202009
NVIDIAA40149*37.4-48GB GDDR67202010
NVIDIAA30165*10.3-24GB HBM25202104
NVIDIAH1001979*673480GB HBM322202203
NVIDIARTX4090166*831.324GB GDDR6X1.4202210
NVIDIAA800312*19.59.740GB/80GB HBM2e10202211
NVIDIAH8001979*67180GB HBM318202211
NVIDIAL4121*30.3-24GB GDDR64202303
NVIDIAL40362*90.5-48GB GDDR610202310
NVIDIAL40S733*91.6-48GB GDDR612202311
NVIDIARTX4090D146*731.124GB GDDR6X1.2202312
NVIDIAH20900*--96GB HBM3102024Q1
NVIDIAH2001979*6734141GB HBM3e282024Q2
华为昇腾910256*32-32GB HBM29201908
华为昇腾910B313/376*82/99-64GB HBM312202401
华为昇腾910C781.25--64GB HBM2e--
华为Atlas 300I Pro---24GB LPDDR4X2202106
华为Atlas 300I Duo---48GB/96GB LPDDR4X3.5202201
华为Atlas 800T A22504/3008*656/792-8x64GB HBM80202301
华为Atlas 800I A22240*600-8x32GB/64GB HBM70202303
海光DCU Z10092.423.1-32GB HBM2e7202112
海光DCU K100200100-64GB HBM310202309
海光DCU K100_AI196--64GB GDDR6--
百度昆仑12814-16GB HBM24201912
百度昆仑212832-32GB HBM2e7202108
天数智芯智凯10096--32GB HBM2--
天数智芯天垓100147--32GB HBM2--
天数智芯天垓150190--64GB HBM2e--
昆仑芯P800350--96GB HBM2e--
平头哥PG1123--96GB HBM2e--
寒武纪MLU37096*24-48GB LPDDR56202106
寒武纪MLU590314*62.8-80GB HBM312202406
寒武纪MLU370-S4/S872--24GB LPDDR5--
寒武纪MLU370-X496--24GB LPDDR5--
寒武纪MLU370-X896--48GB LPDDR5--
沐曦曦云C500-PCIE240--64GB HBM2e--
沐曦曦云C500-OAM280--64GB HBM2e--
壁仞BR106B------
壁仞BR100C------
壁仞BR100M------
燧原GCU S308020-32GB HBM2e5202201

参考资料

WIKI

NVIDIA官方资料

技术对比与分析

国产智算加速卡资料

华为昇腾官方资料

其他厂商官方资料

阿里平头哥相关资料

市场分析与趋势

华为昇腾资料


注:本文档数据基于公开资料整理,技术规格已通过官方资料验证。价格数据来源于2024年市场调研,以万元人民币为单位,实际采购价格可能因供应商、采购量、市场波动、地区差异等因素而有所不同。建议在实际采购前咨询最新报价。