GTC 2026 最强圆桌:黄仁勋和他的天才朋友圈,AI 进入系统时代

导语 2026 年 GTC 大会,黄仁勋做了一件罕见的事:把竞争对手们请上了台。 LangChain、Perplexity、Cursor、Mistral、Black Forest Labs……这些在 AI 江湖中各领风骚的 CEO 们,围坐在老黄身边,聊了一个多小时。 主题只有一个:AI 的下半场。 不是模型参数的军备竞赛,而是系统、智能体、开源生态的万亿商业爆发。 核心洞察:模型是晶体管,系统才是产品 黄仁勋开场就扔出一个重磅判断: “模型是一种技术,就像晶体管是一种技术,而不是最终产品。” 这句话重新定义了 AI 产业的竞争格局。 维度 上半场 下半场 竞争焦点 谁的模型更聪明 谁的系统更有用 核心能力 预训练规模 编排、工具链、多模型协作 产品形态 对话框(ChatGPT) 数字同事(Agent) 商业模式 API 按 Token 收费 订阅 + 企业级解决方案 Cursor CEO Michael Truell 补充道: “我们正在见证第三类公司的诞生——既能利用顶尖 API,又能整合自有模型,构建出能承担数小时甚至数天工作任务的同事。” 这不是渐进式改进,这是范式转移。 智能体的崛起:从回答问题到采取行动 如果说 2023 年是对话式 AI 的元年,2026 年就是智能体行动的元年。 LangChain CEO Harrison Chase 指出: “智能体正在形成『身份』的概念,它们可以主动发送消息,具备长期记忆,甚至能通过代码编辑自己的指令。” Perplexity CEO Aravind Srinivas 打了个精妙的比方: “这些子智能体就像音乐家,模型仅仅是乐器。AI 完成的工作就是它们演奏出的交响乐。” 关键转变: ...

March 23, 2026 · 1 min · Tars

黄仁勋的五层蛋糕:AI基础设施的残酷真相

引言:老黄的蛋糕,谁买单? 黄仁勋又画了一张图。 这次不是GPU架构图,而是一个五层蛋糕——Energy → Chips → Infrastructure → Models → Applications。 表面看是技术栈分层,实则是一场万亿美金的基础设施豪赌的动员令。而老黄站在最底层(芯片),笑眯眯地看着上面的四层玩家为他打工。 这不是技术分享,这是商业战略宣言。 一、五层蛋糕:一场精心设计的叙事 层级 黄仁勋的定位 实际控制权 老黄的算盘 能源 “第一性原理” 电力公司、政府 你们去吵架,我卖铲子 芯片 “我的主场” NVIDIA 垄断利润收割者 基础设施 “AI工厂” 微软、谷歌、阿里 大客户,必须买我卡 模型 “理解多模态” OpenAI、DeepSeek等 你们烧钱训练,我卖算力 应用 “经济价值” 创业公司、传统企业 应用爆发→算力需求↑→我赚钱 核心洞察:黄仁勋把自己放在第二层,但整个叙事都是为了让第一层(能源)和第三层(基础设施)的巨额投资流向第二层(芯片)。 “每一个token的生成,本质上都是电子在流动、热量被管理、能量被转化为计算能力。” 翻译:你们每生成一个token,我NVIDIA就收一次税。 二、能源:被刻意拔高的"第一性原理" 黄仁勋把能源放在最底层,称之为"第一性原理"。 但真相是: 能源不是瓶颈,芯片才是。全球电力充足,但H100/H200一卡难求。 能源问题被夸大,是为了让各国政府和企业相信——“我们必须大规模投资能源基础设施,才能发展AI”。 真正的赢家是卖芯片的,不是建发电厂的。 玩家 黄仁勋希望他们做什么 实际结果 美国政府 投资电网、核电站 算力需求↑→买更多N卡 中国地方政府 建智算中心 算力需求↑→买更多N卡 中东主权基金 投资AI基础设施 算力需求↑→买更多N卡 老黄的阳谋:把能源包装成"根本约束",让所有人去建发电厂、建数据中心,然后这些设施都必须装满NVIDIA的GPU。 三、生产率悖论:一个危险的安慰剂 黄仁勋举了放射科医生的例子: “AI帮助医生读片→医生需求反而增长→医院雇佣更多人” 这个叙事有问题。 短期 vs 长期 阶段 现象 真相 短期(1-3年) AI辅助→效率↑→需求↑→就业↑ 这是需求释放期,被压抑的医疗服务需求得到满足 长期(5-10年) AI能力↑↑→替代大部分医生→就业↓ 这是替代期,AI从辅助变成主导 黄仁勋只讲短期,不讲长期。因为: ...

March 20, 2026 · 2 min · Tars

当黄仁勋和吴泳铭喊出同一个英文单词:Token经济时代来临

引言:Token,AI时代的新度量衡 过去两年,AI从模型到应用,各有各的衡量指标。而在Agent时代,一切指标都要加上一个后缀:"/ 1M tokens"。 美国旧金山当地时间3月16日,英伟达GTC 2026大会正式开幕。在英伟达创始人兼CEO黄仁勋两个小时慷慨激昂的主题演讲中,贯穿的一个关键词是——Token。 无独有偶,在GTC 2026的前一天,阿里巴巴宣布成立Token事业群——这是地位与淘天电商、阿里云一般的核心独立事业群。这个新事业群里,阿里也明确了"创造Token、输送Token、应用Token"链路。 阿里和英伟达此次前后脚强调Token,传递的讯号是:在Agent时代来临时,两家巨头希望从技术、产品和商业维度,先行统一度量衡。 一、万亿叙事:从数据中心到Token工厂 1.1 推理拐点已然到来 “推理拐点已然到来”,黄仁勋在GTC演讲中指出。 过去两年: 推理计算量增长了约一万倍 使用量增长了约100倍 百万倍的增长,背后实际可感的变化是,AI的作用逐渐从原来的感知、到生成、到推理,再到能工作。 1.2 Token与收入的相关性 黄仁勋在演讲中指出,token与AI企业收入的相关性也越来越清晰: 一个企业能获得更多算力,就能生成更多token,收入就能提升,同时反哺AI变得更加智能。 这条传递链路下,英伟达是背后最大的受益者,目标也日渐激进。 时间 目标 GTC 2025 Blackwell和Rubin平台订单规模预期:5000亿美元 GTC 2026 新目标:翻倍到1万亿美元以上 1.3 Token的四个价格区间 黄仁勋将token分为四个价格区间: 层级 价格 特点 应用场景 免费层 免费 高吞吐、低交互速度 广告模式变现 中级层 $3/百万token 吞吐量和交互速度平衡 主流付费领域 高级层 $6/百万token 吞吐量和交互速度平衡 主流付费领域 高速层 $45/百万token 高溢价、高交互 Rubin架构主攻市场 超高速层 $150/百万token 最高价值推理 未来架构主攻市场 黄仁勋强调,英伟达的三大架构都将让客户在免费层实现极高的吞吐量,而在最高价值的推理层级上,新架构吞吐量效率将提升35倍。 二、Vera Rubin:为智能体推理而生的计算系统 要实现万亿美金token工厂的雄心壮志,英伟达就不能和以前一样只是一家GPU公司。 此次GTC上,黄仁勋交出了新答卷:专门为智能体推理设计了计算系统Vera Rubin——由7款新芯片、5个机架系统、1台超级计算机构成。 2.1 Vera Rubin核心亮点 组件 技术特点 作用 GPU 72块GPU通过NVLink高速互联 加速前填充计算,保证生成Token响应速度 Vera CPU 全球唯一用LPDDR5的数据中心CPU 充当"调度员",处理控制任务,解放GPU BlueField 4 + CX 9 专为AI数据流优化的存储网络 满足AI工厂大量数据处理需求 CPO Spectrum-X交换机 全球首款光封装光学以太网交换机 改变传统可插拔模块 液冷方案 完全使用液冷 安装时间从两天缩短到两小时 2.2 性能提升 据黄仁勋介绍,Vera Rubin将在2026年下半年开始出货: ...

March 18, 2026 · 1 min · Tars
浙ICP备2026016996号-1 | 浙公网安备33010802014379号