本文基于腾讯研究院《Token经济学的七个问题》一文(作者:白惠天、袁晓辉)深度解读,原文发表于2026年3月31日。


开篇:一组让你重新理解AI产业的数字

2026年3月31日,OpenAI宣布完成新一轮融资,同时抛出一个数据:用户每分钟调用API接口的Token量超过150亿,折算一天约21.6万亿。

几天前,中国国家数据局公布:中国日均Token调用量突破140万亿,两年增长1400倍

这是什么概念?粗略折算,相当于每天生成约2000亿篇千字文章。摩根大通预测,中国AI推理Token消耗将从2025年增长到2030年的3900千万亿——五年再涨370倍

Token是什么?简单说,它是AI处理和生成信息的基本单位,大约对应一到两个汉字。但真正重要的是:Token正在成为AI时代的"千瓦时"——就像"千瓦时"让电力有了价格、“桶"让石油有了期货市场,有了Token,AI经济就有了可以算账的单位。

腾讯研究院这篇文章,用七个问题为这个正在成型的新经济体系画了一张地图。我从商业和产业视角做深度解读。


一、黄仁勋的"五层蛋糕”:AI产业的利润地图

2026年3月,英伟达CEO黄仁勋在GTC大会前发表了一篇署名文章——《AI是一个五层蛋糕》。他把AI产业拆成五层:

层级内容商业含义
第一层能源电力的获取成本
第二层芯片英伟达的主战场
第三层基础设施数据中心、网络
第四层模型智能的载体
第五层应用智能发挥价值

前三层合起来叫**“AI工厂”**,核心功能是制造智能。

贯穿五层的统一计量单位就是Token。AI工厂的关键经营指标——吞吐量、单位成本、每瓦产出、每兆瓦收入——全部围绕Token展开。

商业启示: 这个框架回答的是"在产业链中哪里能赚到钱"。前三层是基建投资,后两层是应用落地。而Token就是贯穿全产业链的"通用货币"。


二、价值分层:不是所有Token都生而平等

同样一个Token:

  • 用来闲聊:百万个值0.01美元
  • 用来写代码:值200美元
  • 用来做法律文档审阅:值1000美元

价值差了十万倍。

为什么?因为Token有一种此前任何生产要素都不具备的属性——可编程性。钢铁做不到这一点,石油做不到,甚至电力也做不到。没有任何一种传统生产要素,能仅凭"指令不同"就改变自身价值百千倍。

数据说话:不到5%的Token消耗,创造了超过80%的可测量价值。

这意味着什么?意味着"平均Token价格"是个伪命题——就像用平均房价来描述一个既有茅草屋又有摩天楼的城市,数字正确,但毫无意义。

投资启示: 关注AI公司,不要看它消耗了多少Token,要看它把Token用在了什么场景上。高价值场景的Token消耗才是真金白银。


三、杰文斯悖论重演:越便宜,花得越多

这是全文最反直觉的发现。

2022年,调用GPT-3级别模型需要60美元/百万Token。到2026年初,同等能力的开源模型只要0.06美元——降了99.9%

驱动降价的是三股力量的相乘效应:硬件效率每年提升2-3倍,算法效率每年提升2-3倍,系统优化每年再提升2-4倍。三者相乘,Token成本每年下降5-10倍。

但悖论来了:

指标2022年2026年变化
Token单价60美元/百万0.06美元/百万↓99.9%
全球企业AI云支出115亿美元370亿美元↑3倍+

单价降了99.9%,但总支出翻了三倍多。

经济学家对此不会陌生——这是经典的杰文斯悖论(Jevons Paradox):160年前,蒸汽机效率大幅提升后,煤炭消耗不降反升。因为效率提升释放了原本被成本约束的潜在需求。

当Token价格是60美元/百万时,只有金融分析、药物发现这些最高价值的任务用得起。当价格降到0.06美元时,代码审查、实时客服、个性化教育、甚至AI角色扮演都变得经济可行了。每个新场景都是新的Token消耗。

投资启示: Token降价不是利空,是利好——它在做大整个蛋糕。投资AI基础设施,赌的是"蛋糕越来越大",而不是"单价越来越低"。


四、下一个爆发点:从"人用AI"到"AI用AI"

过去两年,Token需求增长靠两个驱动力:

  1. C端用户习惯养成(ChatGPT、元宝等成为日常工具)
  2. 企业把大模型嵌入业务流程(客服、代码审查、数据分析)

但这两个驱动力都有一个共同的天花板——人脑。人一天能读多少字、能处理多少信息是有上限的。

2025年底开始,**智能体(Agent)**改变了这个格局。

智能体不是聊天机器人——它是能自主执行任务的AI程序。你给它一个目标,比如"帮我订最便宜的机票",它自己去搜索、比较、填表、付款。整个过程中,它在不断调用大模型、消耗Token,完全不需要人类注意力参与

算一笔账:一个企业部署1000个智能体,每个智能体每天消耗100万Token,一年就是3650亿Token——这相当于一个中等国家所有人类用户的总消耗量。

更关键的是:已经有实验项目让智能体拥有自己的账户,自主接任务、赚收入、再用收入购买更多Token。AI正在从工具变成经济主体。

投资启示: 下一波Token需求暴涨,不再来自人类用得更多,而来自机器自己开始消费。关注Agent基础设施、智能体管理平台、以及AI-to-AI交易协议。


五、中国Token的"三条护城河"

2026年初,在OpenRouter上,中国模型的Token调用份额已经超过60%。DeepSeek、Kimi、Qwen系列在性价比排行榜上碾压了大量美国竞品。

核心驱动力是算法创新。DeepSeek V3采用的**混合专家架构(MoE)**让同等能力的推理成本下降了一个数量级——大模型里有多个专家子模块,每次推理只激活其中一小部分,既保留能力又大幅降低成本。

中国Token的真正竞争优势在三个方面:

优势说明
算法效率MoE架构、量化技术等创新,单位算力的Token产出远高于同行
开源策略DeepSeek、Qwen的开源版本吸引了全球开发者,形成生态飞轮
极致定价中国厂商愿意以接近成本价来换市场份额

需要澄清一个常见误读:在海外平台上提供服务的中国模型,其推理计算通常部署在海外云节点(新加坡、美国等),而非中国境内的数据中心。所谓"Token出海",更准确的说法是中国的AI算法在出海,而不是中国的电力在出海。

投资启示: 中国AI公司的全球竞争力不在算力(芯片受制),而在算法创新和定价策略。关注MoE架构、模型压缩、开源生态建设。


六、三种商业模式 + 一个未来

Token经济中已经出现了三种截然不同的商业模式:

模式代表特点
按量计费OpenAI API、Claude API简单透明,但用户会刻意减少调用
包月订阅ChatGPT Plus($20/月)使用量高5-10倍,一旦形成习惯很难退订
按价值收费实验阶段AI帮你避免1000万损失,收你10万,利润率极高

还有一种正在萌芽的模式:Token期货。企业预购未来的Token额度来锁定价格,就像航空公司对冲油价一样。当Token可以被期货交易的那一天,它就真正完成了从技术概念到经济基础设施的转变。


七、制度建设的窗口期

每一代通用技术都会催生新的制度需求:铁路时代是反垄断法,电力时代是公用事业监管,互联网时代是数据隐私。Token经济也不例外,至少有三个问题需要回答:

  1. 能耗治理:IEA预测,到2030年,全球数据中心用电量将翻倍。一次ChatGPT查询的耗电量约是一次搜索引擎查询的10倍。
  2. 跨境流动:Token作为数字化的智力产品,不需要集装箱和海关,直接跨境交付。现有贸易统计框架还没有一个分类能准确描述这种新型贸易。
  3. 统计盲区:你用免费的ChatGPT写了一封完美的求职信,省下了500美元的职业顾问费——这500美元的价值被创造了,但在GDP中消失了。

移动互联网爆发时,流量计费、网络管理等基础规则花了近十年才逐步成形。Token经济的演进速度远快于移动互联网,留给制度设计者的时间更短。


结语:你的工作,有多少会被Token化?

文章最后留了一个问题给每个人:

你现在的工作中,有多少环节可以被拆解为"输入信息、处理、输出结果"?凡是符合这个模式的标准化流程,迟早会被Token化。

留给人类的,是判断、创意、关系和不确定性——恰恰是单纯依靠Token做不好的事。

但换个角度想: 如果你能理解Token经济的运行逻辑,你就能在AI重塑产业链的过程中,找到属于自己的位置。

这才是读懂这篇长文的真正价值。


散热正常,慧哥。🧊