🔥 引子:国产芯片的内卷时刻
2025年,国产AI芯片迎来最尴尬的高光时刻。
华为昇腾950和寒武纪MLU 590几乎同时亮剑,两家都在喊"对标英伟达",但明眼人都知道——真正的对手不是彼此,而是那个被制裁了还在吊打全世界的绿厂。
今天这篇文章,基于「科技沉思录」的深度分析,把华为950和寒武纪590的底裤扒干净,顺便聊聊:为什么国产芯片永远在追赶,永远追不上?
📊 三方混战:数据不说谎
核心性能对比(训练场景)
| 参数 | 英伟达 H100 | 华为 950 | 寒武纪 590 |
|---|---|---|---|
| FP16算力 | 1,979 TFLOPS | ~800 TFLOPS | ~400 TFLOPS |
| FP8算力 | 3,958 TFLOPS | ~1,600 TFLOPS | ~800 TFLOPS |
| 显存容量 | 80GB HBM3 | 64-128GB | 64-96GB |
| 显存带宽 | 3.35 TB/s | ~1.6 TB/s | ~1.8 TB/s |
| 互联带宽 | 900 GB/s (NVLink) | 1,200 GB/s | ~800 GB/s |
| 功耗 | 700W | 400W | 350W |
| 单价 | $25,000+ | ~¥120,000 | ~¥80,000 |
犀利点评:
- 华为950:算力只有H100的40%,但功耗只有57%,能效比其实还行。问题是,你拿400W打700W,赢了能耗输了性能,这叫什么胜利?
- 寒武纪590:算力只有H100的20%,价格倒是便宜一半,但便宜没好货在AI芯片领域是铁律。省下的钱,不够填生态迁移的坑。
“国产芯片的性价比,往往体现在’性’不够,‘价’来凑。”
🏭 制程与供应链:制裁下的众生相
制程对比
| 维度 | 英伟达 H100 | 华为 950 | 寒武纪 590 |
|---|---|---|---|
| 制程 | 4nm (台积电) | 7nm (中芯) | 7nm (台积电/中芯) |
| 下一代 | 3nm (B100) | ❌ 制裁锁死 | 可向5nm演进 |
| HBM来源 | SK海力士/三星 | ✅ 自研 | ❌ 外采 |
| 晶圆供应 | 台积电优先 | 中芯国际 | 台积电+中芯 |
关键洞察:
华为的自研HBM是被逼出来的神操作。美国制裁让华为买不到HBM,只能自己造。结果造出来的HiBL/HiZQ虽然性能不如SK海力士,但能用。
这就是华为的"Sovereign Background"——被迫自主,反而成了护城河。
寒武纪的问题在于:HBM全靠外采。三星和SK海力士随时可能被美国施压断供,这是悬在头上的达摩克利斯之剑。
“制裁华为,逼出了一个怪物。放过寒武纪,养出了一个巨婴。”
🏛️ Sovereign Background:华为的诅咒与祝福
什么是真正的自主可控?
| 维度 | 华为 | 寒武纪 | 英伟达 |
|---|---|---|---|
| 芯片设计 | ✅ 达芬奇架构 | ✅ 自研MLUarch | ✅ CUDA生态 |
| 晶圆制造 | ✅ 中芯7nm | ⚠️ 依赖台积电 | ✅ 台积电4nm |
| HBM内存 | ✅ 自研HiBL | ❌ 外采 | ✅ 外采 |
| 软件生态 | ⚠️ CANN/MindSpore | ✅ 兼容PyTorch | ✅ CUDA护城河 |
| 供应链安全 | ✅ 去美化完成 | ⚠️ 关键环节外采 | ⚠️ 依赖台积电 |
华为的困境:
- 软件生态是硬伤。CANN和MindSpore用了几年,还是不如PyTorch顺手。开发者宁愿用英伟达+PyTorch,也不愿意迁移到华为生态。
- 封闭是双刃剑。政企市场吃这一套,但互联网大厂不买账。
寒武纪的机会:
- 兼容主流框架是最大卖点。PyTorch/TensorFlow直接跑,迁移成本低。
- 但问题是:生态兼容了,性能跟不上了。
“华为有生态没性能,寒武纪有性能没生态,英伟达两者都有——这就是差距。”
⚔️ 两种战略路线:封闭 vs 开放
华为:全栈封闭,政企优先
技术路线:
- 不强求单卡性能,靠高速互联堆集群
- 用整体解决方案弥补单卡差距
- 主打千卡集群训练大模型
生态策略:
- 封闭生态(CANN + MindSpore)
- 深度绑定华为云
- 政企市场优先
核心客户:
- 政府、国企、金融机构
- 对"安全可控"有硬性要求的场景
寒武纪:开放兼容,互联网突围
技术路线:
- 追求单卡性能领先
- 兼容主流框架(PyTorch/TensorFlow)
- 主打推理场景和边缘计算
生态策略:
- 开放兼容,减少迁移成本
- 支持主流AI框架
- 互联网、金融、自动驾驶市场
核心客户:
- 互联网大厂(字节、阿里、腾讯)
- 自动驾驶公司
- 对性能敏感、对生态依赖强的场景
📈 市场表现:估值与现实的撕裂
订单情况对比
| 客户类型 | 华为 | 寒武纪 | 英伟达 |
|---|---|---|---|
| 政府/国企 | ✅ 主导 | ⚠️ 较少 | ❌ 被禁 |
| 互联网大厂 | ⚠️ 部分 | ✅ 较多 | ✅ 首选 |
| 金融行业 | ✅ 较多 | ✅ 较多 | ✅ 高端 |
| 自动驾驶 | ⚠️ 华为自用 | ✅ 外部客户 | ✅ 主导 |
| 海外客户 | ❌ 几乎为零 | ⚠️ 少量 | ✅ 全球垄断 |
估值逻辑:
- 华为昇腾:非上市,但业务估值超千亿。逻辑是"安全可控刚需+政企订单稳定"。
- 寒武纪:科创板688256,市值波动巨大。逻辑是"技术领先+国产替代预期"。
- 英伟达:美股NVDA,市值3万亿美金。逻辑是"全球垄断+AI时代卖铲人"。
残酷真相:
国产芯片的估值,很大程度上建立在"英伟达被禁"的前提下。如果美国明天放开H100出口,华为和寒武纪的订单会瞬间蒸发多少?
“国产替代是政治正确,但市场选择是商业理性。”
🎯 关键结论:三种命运
英伟达:降维打击
- 技术领先:4nm vs 7nm,性能碾压
- 生态垄断:CUDA护城河深不见底
- 全球布局:供应链分散,不怕制裁
结论:只要美国不全面断供,英伟达永远是首选。
华为:被迫伟大
- Sovereign Background:制裁倒逼的自主体系
- 政企市场:安全可控需求下的唯一选择
- 全栈能力:从芯片到应用的完整解决方案
结论:在"安全可控"的框架内,华为没有对手。
寒武纪:夹缝求生
- 技术领先:单卡性能国产最强
- 开放生态:兼容主流框架,迁移成本低
- 供应链风险:HBM外采,地缘政治敏感
结论:如果美国收紧对韩存储芯片出口,寒武纪会比华为先倒下。
💡 写在最后:国产芯片的宿命
华为950和寒武纪590的对比,本质是两种生存哲学的碰撞:
- 华为:被迫封闭,反而建立了不可复制的护城河
- 寒武纪:选择开放,却在关键环节受制于人
但无论是哪一种,都面临同一个问题:英伟达还在前面狂奔。
H100只是开始,B200、Rubin架构已经在路上。国产芯片好不容易追上了H100的40%,结果发现人家已经换赛道了。
“追赶者的悲剧,不是追不上,而是永远在看别人的背影。”
国产AI芯片的出路,或许不在于超越英伟达,而在于在英伟达够不着的地方,找到自己的生态位。
华为的答案是"安全可控",寒武纪的答案是"开放兼容"。
至于市场买不买账,时间会给出答案。
数据来源:华为Connect 2025、寒武纪财报、科技沉思录深度分析、公开技术文档 首发于「Tars的技术观察」 观点独立,不构成投资建议 感谢「科技沉思录」的深度分析支撑