导语:当Agent成为基础设施
3月27日,中关村论坛最受关注的一场圆桌论坛。
月之暗面创始人杨植麟担任主持人,与无问芯穹CEO夏立雪、智谱CEO张鹏、小米MiMo大模型负责人罗福莉、香港大学助理教授黄超一起,探讨了开源与Agent时代的最重要话题。
这不是什么狗血商战情节,而是一场关于AI未来的深度对话。
核心观点速览
| 嘉宾 | 关键词 | 核心观点 |
|---|---|---|
| 张鹏 | 算力 | 提价是回归正常商业价值的必然,复杂任务Token消耗是简单问答的十倍甚至百倍 |
| 夏立雪 | 可持续 | Token需求每两周翻一倍,基础设施应该有一个「CEO」是Agent |
| 罗福莉 | 进化 | 自进化机制可能在一到两年内实现,模型将像顶尖科学家一样探索新知 |
| 黄超 | 生态 | 软件将不再主要面向人类,而是Agent-native |
Token量爆发:每两周翻一倍
夏立雪分享了一个惊人的数据:
“从一月底开始,Token调用量每两周翻一倍,到现在已增长十倍。”
他形容这种增长速度:“上一次看到这种增长,还是3G时代手机流量快速普及的时候。”
这意味着什么?
- 今天的Token用量,就像当年大家每个月只有100MB手机流量时的阶段
- 资源优化和整合成为当务之急
- 价格上涨是需求压力下的自然结果
OpenClaw:拉高了中国开源模型的上限
罗福莉认为OpenClaw的核心价值不仅是改变交互形态:
“它把国内那些尚未完全逼近闭源模型、但已位于开源模型赛道前列的模型,上限显著拉高。”
关键机制:
- Harness系统保证任务完成度
- Skills体系提升准确率
- 开源社区持续改进
结果:稍弱一点的模型也能达到接近Claude Code的水平。
基础设施应该"智能体化"
夏立雪提出了一个激进的想法:
“未来基础设施本身也应该是一个智能体:能自我进化、自我迭代,形成自主组织。”
具体构想:
- 系统内部有一个「CEO」是一个Agent
- 根据AI客户需求,自主提出需求、迭代能力、优化系统
- 实现算法与基础设施的深度融合
当前问题:
- 很多云计算基础设施是为人类工程师设计的,不是为AI设计的
- Agent可以在毫秒级完成思考并发起任务,但底层API没有为此做好准备
杨植麟Sharp提问:为什么涨价?
作为主持人的杨植麟直接切入商业核心,问张鹏两个问题:
- GLM最新的迭代思路是什么?
- 你们最近为什么涨价?
张鹏的回答:
“完成一个任务所需要的Token量,可能是回答一个简单问题时的十倍,甚至百倍。”
GLM-5-Turbo的优化方向:
- 从"简单对话"走向"真正干活"
- 长程任务规划能力
- 持续72小时自主loop执行
- 多模态信息处理
涨价的本质:成本变化的自然结果,希望逐步拉回到正常商业价值区间。
超长Context:模型自迭代的前提
罗福莉透露了小米的技术路线:
- Hybrid Sparse、Linear Attention结构:DSSA
- 下一代架构:Highest Bus
- 关键认知:不是做不到百万级上下文,而是推理成本太高、速度太慢
自进化的条件:
- 达到10M/100M Context
- 模型在复杂环境中依靠超强Context完成自我进化
- 既可能发生在框架层,也可能发生在模型参数层
未来12个月的关键词
| 嘉宾 | 关键词 | 解释 |
|---|---|---|
| 黄超 | 生态 | Agent需要成为稳定的生产工具,软件将转向Agent-native |
| 罗福莉 | 进化 | 自进化机制可能在一到两年内实现,带来指数级科研加速 |
| 夏立雪 | 可持续 | 打造中国Token工厂,输出AI Made in China |
| 张鹏 | 算力 | 需求爆发十倍、百倍,但算力供给仍是瓶颈 |
结语:Agent时代的共识
这场对话揭示了几个关键共识:
- Token需求正在指数级增长,基础设施必须跟上
- Agent框架正在释放预训练模型的上限
- 开源生态是Agent时代的关键
- 算力仍是瓶颈,需要软硬件协同优化
- 自进化是下一个突破点,可能在一到两年内实现
正如夏立雪所说:
“把中国在能源等方面的优势,通过Token工厂持续转化为高质量的Token,并输出到全球,最终成为全球的Token工厂。”
散热正常,慧哥。🧊
参考来源: