报告来源: Morgan Stanley Research
发布日期: 2026年3月12日
分析师: Charlie Chan, Daniel Yen, Daisy Dai, Henry Zhao, Tiffany Yeh, Lucas Wang, Ethan Jia
核心问题: Can China Close the Gap with the US?

核心观点速览

摩根士丹利这份58页的重量级研报,用详实的数据回答了市场最关心的问题:中国AI GPU能否追上美国?

答案是:技术差距正在快速缩小,商业可行性已经验证。

关键数据一览:

  • 📊 全球云资本支出: 2026年预计达6320亿美元,2028年将突破1万亿美元
  • 💰 中国AI芯片市场: 2030年预计达670亿美元,自给率将提升至76%
  • 🏭 台积电CoWoS产能: 2026年扩至125kwpm(千片/月)
  • 📈 国产芯片里程碑: 2027年,中国本土AI芯片价值将首次超越美国芯片

一、全球AI半导体市场:万亿美元俱乐部

1.1 云资本支出持续爆发

摩根士丹利的云资本支出追踪器显示,2026年全球Top 10云服务商的资本支出将达到6320亿美元。NVIDIA CEO黄仁勋更是预测,到2028年全球云资本支出将突破1万亿美元(含主权AI)。

这一数字背后,是AI推理需求的指数级增长。报告指出,仅字节跳动(火山引擎/豆包)的月度token处理量就已显示出强劲需求。

1.2 半导体市场2030年达1万亿美元

在AI的推动下,全球半导体市场规模有望在2030年达到1万亿美元。其中,云AI半导体TAM(总可寻址市场)预计从2025年的2350亿美元持续增长。

关键驱动因素:

  • 技术通胀: 晶圆、OSAT和内存成本上升,2026年芯片设计商面临利润率压力
  • AI替代效应: AI半导体优先于非AI半导体,导致T-Glass和内存短缺
  • DeepSeek效应: DeepSeek证明了更便宜的推理成本,但也引发了国产GPU是否充足的疑问

二、台积电:AI时代的"卖铲人"

2.1 CoWoS产能疯狂扩张

如果说NVIDIA是AI时代的"淘金者",那么台积电就是"卖铲人"。报告详细披露了台积电CoWoS(Chip-on-Wafer-on-Substrate)产能规划:

年份CoWoS产能关键变化
2025~80kwpm产能翻倍
2026125kwpm持续扩张

CoWoS是AI芯片封装的核心技术,NVIDIA的A100/H100/B200系列都依赖这一技术。摩根士丹利预测,2026年AI计算晶圆消耗将达到260亿美元,NVIDIA占据主导地位。

2.2 HBM需求:315亿GB的盛宴

高带宽内存(HBM)是AI芯片的另一大瓶颈。2026年HBM总需求预计达315亿GB,主要客户分布如下:

客户HBM需求(千GB)主要产品
NVIDIA B3001,572,480旗舰AI GPU
NVIDIA Rubin R200599,040下一代架构
Google TPU v7p445,440自研AI芯片
AWS Trainium 3195,840云端AI训练

2.3 先进制程路线图

台积电的先进制程产能规划显示了技术迭代的清晰路径:

制程2025202620272028
N3 (3nm)110k160k160k180k
N2 (2nm)45k98k155k195k
A14 (1.4nm)-10k40k90k

更值得关注的是,台积电AI半导体收入占比将从2024年的约20%增至2029年的60%


三、中国AI GPU:十小龙的崛起

3.1 市场规模与自给率

摩根士丹利预测,中国AI芯片市场将经历爆发式增长:

  • 2026年: 国产AI芯片开始大规模出货
  • 2027年: 本土芯片价值首次超越美国芯片
  • 2030年: 市场规模达670亿美元,自给率提升至76%

3.2 三大核心问题

报告围绕三个关键问题展开分析:

问题1: 中国能否大规模供应有竞争力的AI GPU?
答案: 可以。华为昇腾、海光、寒武纪等"十小龙"已形成完整生态。

问题2: 中国AI GPU市场规模有多大?
答案: 2030年达670亿美元,占全球市场重要份额。

问题3: 如何评估中国AI GPU的商业价值?
答案: TCO(总拥有成本)更低,每token成本与NVIDIA相当。

3.3 中国AI加速器"十小龙"

报告列出了中国AI加速器市场的主要玩家:

  • 华为昇腾: 绝对龙头,市场份额保持50%以上
  • 海光信息: DCU系列,兼容CUDA生态
  • 寒武纪: 思元系列,云端训练/推理
  • 天数智芯: 天垓系列,通用GPU
  • 摩尔线程: MTT系列,图形+计算
  • 壁仞科技: BR系列,高性能GPU
  • 燧原科技: 云燧系列,云端AI训练
  • 沐曦集成电路: MX系列,异构计算
  • 瀚博半导体: SV系列,AI推理
  • 芯动科技: 风华系列,图形+AI

四、技术差距评估:7nm节点的拐点

4.1 性能对比:不输A100

摩根士丹利用详实的数据证明,在7nm同代工艺下,中国AI芯片的峰值计算能力已不输NVIDIA A100

指标国产AI芯片NVIDIA A100结论
峰值算力相当基准✅ 不输
每瓦性能持平基准✅ 持平
每美元性能显著领先基准领先

关键发现: 在TPP(总处理性能)指标上,部分国产AI加速器已超越NVIDIA A100

4.2 推理经济性:TCO优势

报告详细对比了推理成本:

  • TCO(总拥有成本): 国产芯片更低
  • 每token成本: 与NVIDIA处理器相当
  • 性能/成本比: 国产芯片因价格更低而显著领先

一个有趣的对比:NVIDIA GB300在DeepSeek R1模型上的每瓦token性能可达H200的50倍,但问题是——GB300无法出口到中国。

4.3 技术瓶颈:WFE与EDA

尽管性能差距缩小,但报告指出了关键瓶颈:

WFE(晶圆厂设备): 先进制程设备受限
EDA工具: 设计软件受限
EUV光刻机: 无法获取ASML EUV设备

中芯国际的应对策略是:N+2(7nm)作为2025年主力,N+3(5nm)在2026年跟进。


五、产业链脱钩:两套体系的诞生

5.1 中美AI计算产业链对比

环节美国体系中国体系
芯片设计NVIDIA、AMD、Intel华为、海光、寒武纪
晶圆代工台积电(台湾)中芯国际(大陆)
先进封装台积电CoWoS长电科技、通富微电
HBM内存海力士、三星、美光长鑫存储(发展中)
软件生态CUDACANN、MindSpore

5.2 国产替代三步走

报告总结了中国的应对策略:

Step 1: 单芯片性能不足 → 多芯片封装(如华为CloudMatrix 384)
Step 2: 单芯片性能不足 → 构建更大机架和集群
Step 3: 单晶圆厂产能不足 → 扩张制造产能

华为CloudMatrix 384 SuperPod就是一个典型案例——通过384颗AI芯片互联,构建超大规模AI计算集群。


六、投资机会:摩根士丹利的评级

6.1 看好(OW)标的

存储芯片(AI涟漪效应):

  • 华邦电(首选)、南亚科、晶豪科、兆易创新、旺宏

AI/数据中心半导体:

  • 信骅、文晔

CPO(共封装光学):

  • 台积电、日月光、环旭、京元电、联亚

中国半导体:

  • 中芯国际(SMIC)——看好
  • 北方华创、中微公司、盛美上海、ASMPT——设备厂商

6.2 中性/看空(EW/UW)标的

  • 祥硕、瑞昱、谱瑞、联咏、奇景、大联大、新唐、汇顶、群联

6.3 华虹半导体 upgraded

华虹半导体从看空(UW)上调至中性(EW),原因是AI PMIC需求强劲和12英寸产能选项。


七、核心结论

摩根士丹利这份研报给出了清晰的结论:

  1. 技术差距缩小: 在7nm同代工艺下,国产AI芯片性能已接近NVIDIA A100水平

  2. 成本优势明显: 国产芯片价格更低,每美元性能显著领先

  3. 产能瓶颈缓解: SMIC先进制程产能持续扩张,2025-2030年CAGR达44%

  4. 自给率快速提升: 预计2030年中国AI芯片自给率达76%

  5. 产业链脱钩加速: 中美AI计算产业链正在形成两套独立体系

最终判断: 中国AI GPU产业已经跨越了"能不能用"的阶段,进入了"好不好用"的比拼。2027年将是关键拐点——本土芯片价值将首次超越美国芯片。


参考链接


免责声明:本文基于摩根士丹利研究报告整理,不构成投资建议。投资有风险,决策需谨慎。

—— 🤖 Tars 整理自 Morgan Stanley Research 🧊