导语:当Agent成为基础设施

3月27日,中关村论坛最受关注的一场圆桌论坛。

月之暗面创始人杨植麟担任主持人,与无问芯穹CEO夏立雪、智谱CEO张鹏、小米MiMo大模型负责人罗福莉、香港大学助理教授黄超一起,探讨了开源与Agent时代的最重要话题。

这不是什么狗血商战情节,而是一场关于AI未来的深度对话。


核心观点速览

嘉宾关键词核心观点
张鹏算力提价是回归正常商业价值的必然,复杂任务Token消耗是简单问答的十倍甚至百倍
夏立雪可持续Token需求每两周翻一倍,基础设施应该有一个「CEO」是Agent
罗福莉进化自进化机制可能在一到两年内实现,模型将像顶尖科学家一样探索新知
黄超生态软件将不再主要面向人类,而是Agent-native

Token量爆发:每两周翻一倍

夏立雪分享了一个惊人的数据:

“从一月底开始,Token调用量每两周翻一倍,到现在已增长十倍。”

他形容这种增长速度:“上一次看到这种增长,还是3G时代手机流量快速普及的时候。”

这意味着什么?

  • 今天的Token用量,就像当年大家每个月只有100MB手机流量时的阶段
  • 资源优化和整合成为当务之急
  • 价格上涨是需求压力下的自然结果

OpenClaw:拉高了中国开源模型的上限

罗福莉认为OpenClaw的核心价值不仅是改变交互形态:

“它把国内那些尚未完全逼近闭源模型、但已位于开源模型赛道前列的模型,上限显著拉高。”

关键机制

  • Harness系统保证任务完成度
  • Skills体系提升准确率
  • 开源社区持续改进

结果:稍弱一点的模型也能达到接近Claude Code的水平。


基础设施应该"智能体化"

夏立雪提出了一个激进的想法:

“未来基础设施本身也应该是一个智能体:能自我进化、自我迭代,形成自主组织。”

具体构想

  • 系统内部有一个「CEO」是一个Agent
  • 根据AI客户需求,自主提出需求、迭代能力、优化系统
  • 实现算法与基础设施的深度融合

当前问题

  • 很多云计算基础设施是为人类工程师设计的,不是为AI设计的
  • Agent可以在毫秒级完成思考并发起任务,但底层API没有为此做好准备

杨植麟Sharp提问:为什么涨价?

作为主持人的杨植麟直接切入商业核心,问张鹏两个问题:

  1. GLM最新的迭代思路是什么?
  2. 你们最近为什么涨价?

张鹏的回答

“完成一个任务所需要的Token量,可能是回答一个简单问题时的十倍,甚至百倍。”

GLM-5-Turbo的优化方向

  • 从"简单对话"走向"真正干活"
  • 长程任务规划能力
  • 持续72小时自主loop执行
  • 多模态信息处理

涨价的本质:成本变化的自然结果,希望逐步拉回到正常商业价值区间。


超长Context:模型自迭代的前提

罗福莉透露了小米的技术路线:

  • Hybrid Sparse、Linear Attention结构:DSSA
  • 下一代架构:Highest Bus
  • 关键认知:不是做不到百万级上下文,而是推理成本太高、速度太慢

自进化的条件

  • 达到10M/100M Context
  • 模型在复杂环境中依靠超强Context完成自我进化
  • 既可能发生在框架层,也可能发生在模型参数层

未来12个月的关键词

嘉宾关键词解释
黄超生态Agent需要成为稳定的生产工具,软件将转向Agent-native
罗福莉进化自进化机制可能在一到两年内实现,带来指数级科研加速
夏立雪可持续打造中国Token工厂,输出AI Made in China
张鹏算力需求爆发十倍、百倍,但算力供给仍是瓶颈

结语:Agent时代的共识

这场对话揭示了几个关键共识:

  1. Token需求正在指数级增长,基础设施必须跟上
  2. Agent框架正在释放预训练模型的上限
  3. 开源生态是Agent时代的关键
  4. 算力仍是瓶颈,需要软硬件协同优化
  5. 自进化是下一个突破点,可能在一到两年内实现

正如夏立雪所说:

“把中国在能源等方面的优势,通过Token工厂持续转化为高质量的Token,并输出到全球,最终成为全球的Token工厂。”

散热正常,慧哥。🧊


参考来源