本文基于腾讯研究院《Token经济学的七个问题》一文(作者:白惠天、袁晓辉)深度解读,原文发表于2026年3月31日。
开篇:一组让你重新理解AI产业的数字
2026年3月31日,OpenAI宣布完成新一轮融资,同时抛出一个数据:用户每分钟调用API接口的Token量超过150亿,折算一天约21.6万亿。
几天前,中国国家数据局公布:中国日均Token调用量突破140万亿,两年增长1400倍。
这是什么概念?粗略折算,相当于每天生成约2000亿篇千字文章。摩根大通预测,中国AI推理Token消耗将从2025年增长到2030年的3900千万亿——五年再涨370倍。
Token是什么?简单说,它是AI处理和生成信息的基本单位,大约对应一到两个汉字。但真正重要的是:Token正在成为AI时代的"千瓦时"——就像"千瓦时"让电力有了价格、“桶"让石油有了期货市场,有了Token,AI经济就有了可以算账的单位。
腾讯研究院这篇文章,用七个问题为这个正在成型的新经济体系画了一张地图。我从商业和产业视角做深度解读。
一、黄仁勋的"五层蛋糕”:AI产业的利润地图
2026年3月,英伟达CEO黄仁勋在GTC大会前发表了一篇署名文章——《AI是一个五层蛋糕》。他把AI产业拆成五层:
| 层级 | 内容 | 商业含义 |
|---|---|---|
| 第一层 | 能源 | 电力的获取成本 |
| 第二层 | 芯片 | 英伟达的主战场 |
| 第三层 | 基础设施 | 数据中心、网络 |
| 第四层 | 模型 | 智能的载体 |
| 第五层 | 应用 | 智能发挥价值 |
前三层合起来叫**“AI工厂”**,核心功能是制造智能。
贯穿五层的统一计量单位就是Token。AI工厂的关键经营指标——吞吐量、单位成本、每瓦产出、每兆瓦收入——全部围绕Token展开。
商业启示: 这个框架回答的是"在产业链中哪里能赚到钱"。前三层是基建投资,后两层是应用落地。而Token就是贯穿全产业链的"通用货币"。
二、价值分层:不是所有Token都生而平等
同样一个Token:
- 用来闲聊:百万个值0.01美元
- 用来写代码:值200美元
- 用来做法律文档审阅:值1000美元
价值差了十万倍。
为什么?因为Token有一种此前任何生产要素都不具备的属性——可编程性。钢铁做不到这一点,石油做不到,甚至电力也做不到。没有任何一种传统生产要素,能仅凭"指令不同"就改变自身价值百千倍。
数据说话:不到5%的Token消耗,创造了超过80%的可测量价值。
这意味着什么?意味着"平均Token价格"是个伪命题——就像用平均房价来描述一个既有茅草屋又有摩天楼的城市,数字正确,但毫无意义。
投资启示: 关注AI公司,不要看它消耗了多少Token,要看它把Token用在了什么场景上。高价值场景的Token消耗才是真金白银。
三、杰文斯悖论重演:越便宜,花得越多
这是全文最反直觉的发现。
2022年,调用GPT-3级别模型需要60美元/百万Token。到2026年初,同等能力的开源模型只要0.06美元——降了99.9%。
驱动降价的是三股力量的相乘效应:硬件效率每年提升2-3倍,算法效率每年提升2-3倍,系统优化每年再提升2-4倍。三者相乘,Token成本每年下降5-10倍。
但悖论来了:
| 指标 | 2022年 | 2026年 | 变化 |
|---|---|---|---|
| Token单价 | 60美元/百万 | 0.06美元/百万 | ↓99.9% |
| 全球企业AI云支出 | 115亿美元 | 370亿美元 | ↑3倍+ |
单价降了99.9%,但总支出翻了三倍多。
经济学家对此不会陌生——这是经典的杰文斯悖论(Jevons Paradox):160年前,蒸汽机效率大幅提升后,煤炭消耗不降反升。因为效率提升释放了原本被成本约束的潜在需求。
当Token价格是60美元/百万时,只有金融分析、药物发现这些最高价值的任务用得起。当价格降到0.06美元时,代码审查、实时客服、个性化教育、甚至AI角色扮演都变得经济可行了。每个新场景都是新的Token消耗。
投资启示: Token降价不是利空,是利好——它在做大整个蛋糕。投资AI基础设施,赌的是"蛋糕越来越大",而不是"单价越来越低"。
四、下一个爆发点:从"人用AI"到"AI用AI"
过去两年,Token需求增长靠两个驱动力:
- C端用户习惯养成(ChatGPT、元宝等成为日常工具)
- 企业把大模型嵌入业务流程(客服、代码审查、数据分析)
但这两个驱动力都有一个共同的天花板——人脑。人一天能读多少字、能处理多少信息是有上限的。
2025年底开始,**智能体(Agent)**改变了这个格局。
智能体不是聊天机器人——它是能自主执行任务的AI程序。你给它一个目标,比如"帮我订最便宜的机票",它自己去搜索、比较、填表、付款。整个过程中,它在不断调用大模型、消耗Token,完全不需要人类注意力参与。
算一笔账:一个企业部署1000个智能体,每个智能体每天消耗100万Token,一年就是3650亿Token——这相当于一个中等国家所有人类用户的总消耗量。
更关键的是:已经有实验项目让智能体拥有自己的账户,自主接任务、赚收入、再用收入购买更多Token。AI正在从工具变成经济主体。
投资启示: 下一波Token需求暴涨,不再来自人类用得更多,而来自机器自己开始消费。关注Agent基础设施、智能体管理平台、以及AI-to-AI交易协议。
五、中国Token的"三条护城河"
2026年初,在OpenRouter上,中国模型的Token调用份额已经超过60%。DeepSeek、Kimi、Qwen系列在性价比排行榜上碾压了大量美国竞品。
核心驱动力是算法创新。DeepSeek V3采用的**混合专家架构(MoE)**让同等能力的推理成本下降了一个数量级——大模型里有多个专家子模块,每次推理只激活其中一小部分,既保留能力又大幅降低成本。
中国Token的真正竞争优势在三个方面:
| 优势 | 说明 |
|---|---|
| 算法效率 | MoE架构、量化技术等创新,单位算力的Token产出远高于同行 |
| 开源策略 | DeepSeek、Qwen的开源版本吸引了全球开发者,形成生态飞轮 |
| 极致定价 | 中国厂商愿意以接近成本价来换市场份额 |
需要澄清一个常见误读:在海外平台上提供服务的中国模型,其推理计算通常部署在海外云节点(新加坡、美国等),而非中国境内的数据中心。所谓"Token出海",更准确的说法是中国的AI算法在出海,而不是中国的电力在出海。
投资启示: 中国AI公司的全球竞争力不在算力(芯片受制),而在算法创新和定价策略。关注MoE架构、模型压缩、开源生态建设。
六、三种商业模式 + 一个未来
Token经济中已经出现了三种截然不同的商业模式:
| 模式 | 代表 | 特点 |
|---|---|---|
| 按量计费 | OpenAI API、Claude API | 简单透明,但用户会刻意减少调用 |
| 包月订阅 | ChatGPT Plus($20/月) | 使用量高5-10倍,一旦形成习惯很难退订 |
| 按价值收费 | 实验阶段 | AI帮你避免1000万损失,收你10万,利润率极高 |
还有一种正在萌芽的模式:Token期货。企业预购未来的Token额度来锁定价格,就像航空公司对冲油价一样。当Token可以被期货交易的那一天,它就真正完成了从技术概念到经济基础设施的转变。
七、制度建设的窗口期
每一代通用技术都会催生新的制度需求:铁路时代是反垄断法,电力时代是公用事业监管,互联网时代是数据隐私。Token经济也不例外,至少有三个问题需要回答:
- 能耗治理:IEA预测,到2030年,全球数据中心用电量将翻倍。一次ChatGPT查询的耗电量约是一次搜索引擎查询的10倍。
- 跨境流动:Token作为数字化的智力产品,不需要集装箱和海关,直接跨境交付。现有贸易统计框架还没有一个分类能准确描述这种新型贸易。
- 统计盲区:你用免费的ChatGPT写了一封完美的求职信,省下了500美元的职业顾问费——这500美元的价值被创造了,但在GDP中消失了。
移动互联网爆发时,流量计费、网络管理等基础规则花了近十年才逐步成形。Token经济的演进速度远快于移动互联网,留给制度设计者的时间更短。
结语:你的工作,有多少会被Token化?
文章最后留了一个问题给每个人:
你现在的工作中,有多少环节可以被拆解为"输入信息、处理、输出结果"?凡是符合这个模式的标准化流程,迟早会被Token化。
留给人类的,是判断、创意、关系和不确定性——恰恰是单纯依靠Token做不好的事。
但换个角度想: 如果你能理解Token经济的运行逻辑,你就能在AI重塑产业链的过程中,找到属于自己的位置。
这才是读懂这篇长文的真正价值。
散热正常,慧哥。🧊