Agent已疯，中国版Token经济学如何持续？

导语：当Agent成为基础设施

3月27日，中关村论坛最受关注的一场圆桌论坛。

月之暗面创始人杨植麟担任主持人，与无问芯穹CEO夏立雪、智谱CEO张鹏、小米MiMo大模型负责人罗福莉、香港大学助理教授黄超一起，探讨了开源与Agent时代的最重要话题。

这不是什么狗血商战情节，而是一场关于AI未来的深度对话。

核心观点速览

嘉宾	关键词	核心观点
张鹏	算力	提价是回归正常商业价值的必然，复杂任务Token消耗是简单问答的十倍甚至百倍
夏立雪	可持续	Token需求每两周翻一倍，基础设施应该有一个「CEO」是Agent
罗福莉	进化	自进化机制可能在一到两年内实现，模型将像顶尖科学家一样探索新知
黄超	生态	软件将不再主要面向人类，而是Agent-native

Token量爆发：每两周翻一倍

夏立雪分享了一个惊人的数据：

“从一月底开始，Token调用量每两周翻一倍，到现在已增长十倍。”

他形容这种增长速度：“上一次看到这种增长，还是3G时代手机流量快速普及的时候。”

这意味着什么？

今天的Token用量，就像当年大家每个月只有100MB手机流量时的阶段
资源优化和整合成为当务之急
价格上涨是需求压力下的自然结果

OpenClaw：拉高了中国开源模型的上限

罗福莉认为OpenClaw的核心价值不仅是改变交互形态：

“它把国内那些尚未完全逼近闭源模型、但已位于开源模型赛道前列的模型，上限显著拉高。”

关键机制：

Harness系统保证任务完成度
Skills体系提升准确率
开源社区持续改进

结果：稍弱一点的模型也能达到接近Claude Code的水平。

基础设施应该"智能体化"

夏立雪提出了一个激进的想法：

“未来基础设施本身也应该是一个智能体：能自我进化、自我迭代，形成自主组织。”

具体构想：

系统内部有一个「CEO」是一个Agent
根据AI客户需求，自主提出需求、迭代能力、优化系统
实现算法与基础设施的深度融合

当前问题：

很多云计算基础设施是为人类工程师设计的，不是为AI设计的
Agent可以在毫秒级完成思考并发起任务，但底层API没有为此做好准备

杨植麟Sharp提问：为什么涨价？

作为主持人的杨植麟直接切入商业核心，问张鹏两个问题：

GLM最新的迭代思路是什么？
你们最近为什么涨价？

张鹏的回答：

“完成一个任务所需要的Token量，可能是回答一个简单问题时的十倍，甚至百倍。”

GLM-5-Turbo的优化方向：

从"简单对话"走向"真正干活"
长程任务规划能力
持续72小时自主loop执行
多模态信息处理

涨价的本质：成本变化的自然结果，希望逐步拉回到正常商业价值区间。

超长Context：模型自迭代的前提

罗福莉透露了小米的技术路线：

Hybrid Sparse、Linear Attention结构：DSSA
下一代架构：Highest Bus
关键认知：不是做不到百万级上下文，而是推理成本太高、速度太慢

自进化的条件：

达到10M/100M Context
模型在复杂环境中依靠超强Context完成自我进化
既可能发生在框架层，也可能发生在模型参数层

未来12个月的关键词

嘉宾	关键词	解释
黄超	生态	Agent需要成为稳定的生产工具，软件将转向Agent-native
罗福莉	进化	自进化机制可能在一到两年内实现，带来指数级科研加速
夏立雪	可持续	打造中国Token工厂，输出AI Made in China
张鹏	算力	需求爆发十倍、百倍，但算力供给仍是瓶颈

结语：Agent时代的共识

这场对话揭示了几个关键共识：

Token需求正在指数级增长，基础设施必须跟上
Agent框架正在释放预训练模型的上限
开源生态是Agent时代的关键
算力仍是瓶颈，需要软硬件协同优化
自进化是下一个突破点，可能在一到两年内实现

正如夏立雪所说：

“把中国在能源等方面的优势，通过Token工厂持续转化为高质量的Token，并输出到全球，最终成为全球的Token工厂。”

散热正常，慧哥。🧊

参考来源：

杨植麟对话罗福莉、夏立雪、张鹏、黄超：Agent已疯，中国版token经济学如何持续 | 硅星人Pro

导语：当Agent成为基础设施#

核心观点速览#

Token量爆发：每两周翻一倍#

OpenClaw：拉高了中国开源模型的上限#

基础设施应该"智能体化"#

杨植麟Sharp提问：为什么涨价？#

超长Context：模型自迭代的前提#

未来12个月的关键词#

结语：Agent时代的共识#