引言:199元买了一张算力排队票
“高峰时段算力不足”
这是Kimi用户最近最熟悉的提示。花了199元/月开通Allegretto套餐,布局KimiClaw的最低配套餐,结果呢?Agent任务跑到一半断掉是家常便饭。
MiniMax那边更离谱。龙虾部署上去,聊两句就掉线,API动不动返回限速警告。用户@客服:“今天已经连续掉线了,聊2句就掉了。“客服回复:建议您检查本地网络。
简单来说:你花了钱,但算力不一定是你的。什么时候能用上,看运气。
2026年春天:国产AI进入"用不了"时代
这不是个例,而是行业通病。
- 2月10日:Kimi因算力告急宕机,官方回应堪称行为艺术:“正在找算力。要不先用DeepSeek。”
- 2月28日、3月5日:DeepSeek接连大规模宕机,服务器繁忙
一家融了超20亿美元、手握100亿现金的公司,在自家产品最火的时候让用户去用竞品。
2026年春天,国产AI集体进入了**“用不了"时代**。
算力荒的真相:Agent改变了需求曲线
禁令是背景,Agent是主因
直觉上,“算力荒"好像是禁令的锅。这个有道理,但不精确。
DeepSeek和Qwen这些模型本身就在资源约束下设计,MoE架构天然省算力。Kimi总裁张予彤在达沃斯说得很直白:
“仅用美国顶尖实验室1%的资源,做出了全球领先的开源模型。”
真正击穿基础设施的,是Agent。
Chatbot vs Agent:算力消耗的天壤之别
| 场景 | 算力消耗 |
|---|---|
| Chatbot单轮对话 | 约1,000-3,000 token |
| Agent中等复杂度任务 | 轻松10万token |
| Agent复杂任务 | 百万级token |
| 极端场景(OpenClaw深度研究) | 800万token |
粗略估计:从Chatbot到Agent,单次任务算力消耗放大30到100倍,极端场景1,000倍以上。
为什么Agent这么吃算力?
Chatbot是一问一答,算力消耗线性可预测。
Agent完全不同——一个任务背后可能触发几十上百次模型调用:
- 规划
- 拆解
- 执行
- 反思
- 纠错
每一步都过模型。长上下文持续占显存,工具调用让GPU空转。
类比:
- Chatbot时代,GPU像餐厅服务员,上完菜就去下一桌
- Agent时代,服务员全程陪同,从点菜到结账,思考菜单时也不能走
- 同样数量的服务员,能服务的桌数断崖式下降
上游扛得住吗?信号已经出现
云厂商集体涨价
今年3月,国内云厂商开始集体调价——AI算力和存储产品价格上涨,涨幅从个位数到30%以上不等。
- 优刻得:直接开启全系涨价
- 海外:AWS和谷歌云在部分产品上试水调价
- SK海力士:公开表示2026年存储芯片持续涨价已成定局,DRAM库存仅剩约4周
持续二十年的"云服务只降不升"铁律,被AI需求击穿了。
涨价的逻辑
云厂商过去一年疯狂扩建AI算力基础设施,资本开支动辄数百亿量级,但AI业务本身的利润率还很薄,远不够覆盖基建投入。
Token调用量在指数级增长——2026年2月国内主流大模型日均消耗合计约180万亿——但卖Token的收入增速追不上建数据中心的花钱速度。
涨价,不是云厂商贪心,是供应链涨价的无奈之举。
设备折旧的困境
AWS、Google Cloud、Azure三家在2023-2024年统一把服务器折旧年限从3-4年延长到了6年,集体节省了约180亿美元的年度折旧开支。
但NVIDIA的芯片迭代周期只有18-24个月——你今天花几千亿建的数据中心,里面的GPU可能两年后就不是最优选择了,折旧却要摊6年。
Satya Nadella自己都说:“我不想在一代芯片上背四五年的折旧。”
Kimi和MiniMax的困境:两头堵
轻资产模式的代价
Kimi和MiniMax自己并不拥有GPU。
- Kimi:火山引擎+阿里云双轨供应
- MiniMax:阿里云、腾讯云、火山引擎三家供应商,早期招标会上三家杀到2折竞价
谁也没想到,随着Agent到来,token需求的爆发来得如此之快。
四层传导压力
算力荒是从芯片到云服务到模型公司到用户的四层传导:
- 芯片禁令与供应紧张
- 云厂商基建投入与折旧压力
- 模型公司轻资产模式与成本飙升
- 用户体验下降与付费意愿考验
Kimi和MiniMax站在最下游,承受每一层压力的叠加。
财务数据的压力
- MiniMax 2025年:营收不足8000万美元,经调整净亏损2.5亿,毛利率刚爬到25%
- Kimi:账上100亿资金,但传闻开始考虑赴港上市
上游一涨价,这个刚转正的毛利随时可能被吃掉。
算力市场的格局:轻vs重
| 厂商 | 日均Token | 市场份额 | 策略 |
|---|---|---|---|
| 火山引擎(豆包) | 63万亿 | 49.2% | 轻资产,调用量第一 |
| 阿里云 | 32万亿 | 35.8%营收份额 | 重资产,营收第一 |
| 腾讯元宝 | 28万亿 | - | - |
| DeepSeek | 22万亿 | - | - |
关键洞察:调用量第一和营收第一不是同一家。
- 火山赢在"轻”——弹性伸缩、按需付费
- 阿里赢在"重”——自建数据中心、长期投入
未来:涨价什么时候会停?
短期内看不到头
Agent的需求曲线还在陡峭的上升期:
- Kimi K2.5刚上线不到一个月,收入就超过了2025年全年
- MiniMax M2.5发布首周Token消耗量超过三家竞品之和
多Agent并行、长上下文推理、编程场景的爆发才刚刚开始,每一个新场景打开都意味着Token消耗量再上一个台阶。
供给侧的周期
数据中心从规划到投产至少18个月,芯片禁令下国产替代的产能爬坡更慢。
需求按周增长,供给按年追赶,中间的剪刀差就是涨价和限流的空间。
云厂商的重资产转型
阿里宣布三年投入3800亿建AI基础设施,字节在火山引擎上的算力部署同样激进。
这些投入一旦启动就停不下来——你今天不建,明天的Token就没地方跑;但建了之后,折旧摊销会在未来五到十年持续压在利润表上。
这很像二十年前电信运营商铺3G/4G网络的周期:
- 需求爆发倒逼巨额基建
- 基建倒逼涨价或补贴退坡
- 最终整个行业的利润结构被重塑
区别在于,电信行业有牌照壁垒和政策保护,云厂商没有。
写在最后
2026年,Agent改变了算力的需求曲线。便宜的智能没变贵,使用智能的方式变了,资源出现了挤兑。
对于站在链条最下游的Kimi和MiniMax们来说,算力成本不会回到价格战时代的地板价了。
对于用199元套餐跑Agent的用户来说,“便宜好用的AI"这个窗口期,可能比所有人想象的都要短。
本文整理自微信公众号「象先志」