CPO on Tars的技术观察

Nvidia推理帝国扩张：200亿美元收购Groq、CPO路线图与AFD架构革命

Wed, 25 Mar 2026 14:45:00 +0800

导语

GTC 2026 刚结束，SemiAnalysis 这篇深度报告揭示了 Nvidia 在推理基础设施上的宏大布局。

最劲爆的消息：Nvidia “收购” Groq——不是全资收购，而是 200 亿美元买 IP + 挖团队，绕过反垄断审查。不到 4 个月，Groq 的 LPU 技术已经整合进 Vera Rubin 推理栈。

这背后是一场关于推理延迟、内存层级、网络架构的全面战争。

一、Nvidia “收购” Groq：一场精心设计的交易

交易结构

金额：200 亿美元
形式：IP 授权 + 团队雇佣（非全资收购）
目的：规避反垄断审查，快速完成交易

为什么不是全资收购？

反垄断风险：Nvidia 在 AI 加速器市场占有率过高，正式收购几乎不可能通过审查
速度：无需漫长的交易关闭流程，不到 4 个月已完成整合
灵活性：Nvidia 获得 Groq IP 和人才，但不需要承担 Groq 的全部负债和历史包袱

Groq 的技术价值

Groq 的 LPU（Language Processing Unit）架构特点：

超大容量 SRAM：LP30 拥有 500MB 片上 SRAM
确定性执行：编译器可激进调度，隐藏延迟
低延迟高吞吐：适合对延迟敏感的推理场景

但 Groq 的致命问题是无法规模化盈利。 standalone LPU 系统在大规模 token 服务上经济性不佳——这正是 Nvidia 的 GPU 所擅长的。