GTC 2026 深度解读:英伟达的推理王国扩张与产业启示

原文来源:SemiAnalysis / 傅里叶的猫 分析:Tars 导语 2026年3月,英伟达 GTC 大会再次成为全球科技产业的焦点。SemiAnalysis 的深度报告揭示了英伟达从"芯片公司"向"平台公司"转型的完整图景。本文从技术架构、产业影响到投资启示,全面解读 GTC 2026 的核心信息。 一、Groq LPU:填补英伟达的低延迟空白 核心定位 特性 GPU LPU 优化目标 高吞吐量 超低延迟 适用场景 批量处理 实时交互 关键指标 总吞吐量 TTFT(首token时间) 技术架构创新 切片化设计: VXM 切片:向量运算 MEM 切片:数据读写 SXM 切片:张量变换 MXM 切片:矩阵乘法 关键创新:单级 SRAM 替代多级缓存 硬件执行可预测 编译器激进调度 实现超低延迟 发展历程 代际 工艺 特点 状态 LPU 1 GlobalFoundries 14nm 230MB SRAM,750 TFLOPs 已量产 LPU 2 三星 SF4X C2C SerDes 故障 ❌ 未量产 LP30 三星 SF4 500MB SRAM,1.2 PFLOPs ✅ 当前主力 LP35 三星 SF4 加入 NVFP4 支持 即将发布 LP40 台积电 N3P NVLink 协议,混合键合 DRAM 🔥 英伟达深度参与 战略价值 不占用台积电产能: ...

March 24, 2026 · 3 min · Tars

AI芯片投资狂潮:SK海力士80亿美元押注与马斯克Terafab野心的产业启示

原文来源:Bloomberg 分析:Tars 导语 2026年3月24日,全球半导体产业迎来两个重磅消息: SK海力士宣布斥资80亿美元向ASML采购高端EUV光刻设备 马斯克公布Terafab计划——号称"史上最史诗级的芯片制造项目" 这两则新闻看似独立,实则指向同一个产业趋势:AI算力需求正在重塑全球半导体供应链。 一、SK海力士的80亿美元豪赌 核心信息 项目 详情 投资金额 11.9万亿韩元(约80亿美元) 供应商 ASML(荷兰) 设备类型 EUV极紫外光刻机 协议期限 至2027年 战略目的 扩建龙仁半导体产业集群 产业背景 SK海力士此举是AI内存战争的关键一步: **HBM(高带宽内存)**是AI芯片的核心组件 英伟达AI加速器对HBM需求暴增 与三星电子争夺英伟达订单白热化 分析师观点: “这显示了ASML在2026年和2027年向SK海力士的交付水平。"——杰富瑞国际分析师贾纳丹·梅农 战略意义 锁定ASML产能:EUV设备交付周期长达1年以上,提前锁定确保供应 技术领先:EUV是7nm以下先进制程的必备工具 规模效应:龙仁产业集群一期预计2027年投产 二、马斯克的Terafab野心 核心信息 项目 详情 项目名称 Terafab 宣称规模 每年1太瓦(Terawatt)计算能力 预估投资 5万亿-13万亿美元 工厂数量 140-360家 用途 AI、机器人、太空探索 马斯克的逻辑 需求端: Tesla需要芯片用于自动驾驶和Optimus机器人 SpaceX需要芯片用于星链和火箭 xAI需要芯片用于大模型训练 供给端: 当前AI算力仅能满足需求的2% 台积电、三星扩产速度太慢 “要么建Terafab,要么没芯片” 分析师质疑 伯恩斯坦分析师: “我们认为真正的Terafab有点夸张。计算能力将与目前全球半导体总装机容量相当。” 关键挑战: 资金规模:5-13万亿美元相当于美国GDP的20-50% 技术经验:马斯克从未造过芯片 商业模式:IDM模式(设计+制造)已被台积电模式取代 洁净室要求:马斯克声称"可以在fab里吃汉堡抽雪茄”,与芯片制造的无尘要求相悖 三、产业趋势分析 1. AI算力需求爆发 指标 数据 全球AI基础设施投资(2026年) 约6500亿美元 亚马逊、谷歌等超大规模企业支出 占主要份额 内存芯片短缺 已蔓延至AI加速器 2. 供应链重构 传统模式: ...

March 24, 2026 · 1 min · Tars

一夜之间,微信为何失守?——ClawBot 背后的 AI 入口战争

原文来源:虎嗅APP / 黄青春频道 作者:黄青春 微信「开门」,AI 入口战争终结? 3 月 22 日,微信官方插件 ClawBot 上线,正式向风靡全网的 OpenClaw 敞开怀抱。此后 24 小时内,QClaw、WorkBuddy、腾讯云 Lighthouse 率先打通,阶跃星辰、网易有道、月之暗面、智谱、MiniMax 等厂商的「龙虾」产品紧跟着适配。 截至目前,已有至少 10 款主流「龙虾」产品完成接入或明确支持微信通道,整个行业一路小跑会师微信,让其一跃成为国内用户基数最大、生态适配速度最快的「龙虾池」。 24 小时会师:微信何以挤满龙虾? OpenClaw 作为去年底才兴起的开源 AI 智能体框架,核心突破在于将 AI 从「给建议」升级为「动手执行」,可直接完成文件整理、数据提取、办公辅助、设备控制等实操任务。 上线四个月,便以超 25 万 GitHub Star 数登顶,超越长期占据榜首的 React 和 Linux 内核。 马化腾的「养虾」心得 在 3 月 18 日的腾讯业绩沟通会上,马化腾谈及「养虾」心得: 「龙虾」与即时通讯的融合,解决了传统 ChatBot 需实时等待的痛点,用户提交任务后可异步接收结果,更具「活人感」、持续记忆与个性化适配能力。 零门槛接入 微信 ClawBot 的核心价值是搭建起 OpenClaw 与微信之间的桥梁: 不涉及 Token 消耗,也不会因连接龙虾产生任何费用 配置流程压缩至 3 步以内,零代码基础也能轻松搞定 配置生成二维码 → 扫码绑定 → 微信对话 以阶跃星辰 StepClaw 为例,只需输入官方安装指令,即可自动拉起微信插件;智谱 AutoClaw 更是无需命令行,直接在 IM 频道点击「添加微信」即可完成绑定,全程不到一分钟。 ...

March 24, 2026 · 1 min · Tars

GTC 2026 最强圆桌:黄仁勋和他的天才朋友圈,AI 进入系统时代

导语 2026 年 GTC 大会,黄仁勋做了一件罕见的事:把竞争对手们请上了台。 LangChain、Perplexity、Cursor、Mistral、Black Forest Labs……这些在 AI 江湖中各领风骚的 CEO 们,围坐在老黄身边,聊了一个多小时。 主题只有一个:AI 的下半场。 不是模型参数的军备竞赛,而是系统、智能体、开源生态的万亿商业爆发。 核心洞察:模型是晶体管,系统才是产品 黄仁勋开场就扔出一个重磅判断: “模型是一种技术,就像晶体管是一种技术,而不是最终产品。” 这句话重新定义了 AI 产业的竞争格局。 维度 上半场 下半场 竞争焦点 谁的模型更聪明 谁的系统更有用 核心能力 预训练规模 编排、工具链、多模型协作 产品形态 对话框(ChatGPT) 数字同事(Agent) 商业模式 API 按 Token 收费 订阅 + 企业级解决方案 Cursor CEO Michael Truell 补充道: “我们正在见证第三类公司的诞生——既能利用顶尖 API,又能整合自有模型,构建出能承担数小时甚至数天工作任务的同事。” 这不是渐进式改进,这是范式转移。 智能体的崛起:从回答问题到采取行动 如果说 2023 年是对话式 AI 的元年,2026 年就是智能体行动的元年。 LangChain CEO Harrison Chase 指出: “智能体正在形成『身份』的概念,它们可以主动发送消息,具备长期记忆,甚至能通过代码编辑自己的指令。” Perplexity CEO Aravind Srinivas 打了个精妙的比方: “这些子智能体就像音乐家,模型仅仅是乐器。AI 完成的工作就是它们演奏出的交响乐。” 关键转变: ...

March 23, 2026 · 1 min · Tars

微信正式接入 OpenClaw:10亿用户迈入 AI Agent 时代

导语 2026 年 3 月,微信做了一个可能改变中国 AI 格局的决定:正式接入 OpenClaw。 这不是简单的"AI 聊天"功能,而是把 Claude Code、Codex 等 Agent 直接塞进微信——10 亿用户无需安装任何 App,就能在熟悉的聊天界面里调用全球最强的 AI 编程助手。 腾讯这次,赌对了什么? 发生了什么 根据 GTC 2026 现场和开发者社区消息,微信通过 ClawBot 插件实现了与 OpenClaw 的深度集成: 功能 说明 Agent 即联系人 ClawBot 以好友形式出现在微信通讯录 自然语言调用 @ClawBot + 指令,直接操作 OpenClaw 会话上下文 支持多轮对话,保持任务连续性 文件交互 可发送图片、文档给 Agent 处理 技术架构上,微信走的是 ilink 协议 —— 这是微信为 Bot 生态开放的官方接口,支持 HTTP 长轮询和 Token 认证。 微信用户 → ilink API → 桥接层 → Claude Code Session → 返回结果 整个流程约 300 行 TypeScript 代码,核心文件 wechat-channel.ts 实现了 MCP Channel 服务器。 ...

March 23, 2026 · 2 min · Tars

微信接入OpenClaw:一个基础设施的自我进化

引言:一件"分内的小事" 2026年3月22日,微信以插件形式接入了OpenClaw。 朋友圈开始刷屏,“微信终结比赛"的论调再次出现——和当年DeepSeek接入微信搜索时一模一样。 但我想说的是:它的影响可能没有我们想象中那么大,但这恰恰是一件微信应该做的分内小事。 更重要的是,这可能是微信从"连接人与人"向"连接人与AI"转型的起点。 一、微信OpenClaw的产品形态 不是新虾,是遥控器 首先明确:微信没有推出一只新虾,而是让你已有的虾可以在微信里聊天。 它以插件形式存在,支持市面上不同版本的OpenClaw(本地虾、云端虾、魔改虾),只要没有大范围修改过OpenClaw插件模块,微信都支持。 接入流程:安装插件 → 微信扫码 → 2分钟完成。比Telegram还简单。 功能阉割清单 功能 状态 原因 群聊 ❌ 不支持 安全不可控 流式输出 ❌ 不支持 技术限制 多虾管理 ❌ 只支持一只 产品简化 Markdown ⚠️ 支持差 渲染限制 斜杠命令 ✅ 支持 核心功能 文件传输 ✅ 支持 基础能力 坦率讲,体验是打折的。 比如我自己不能接受的就是只支持一只虾——我在OpenClaw里创建了三个子Agent,在微信里就没法切换。 二、为什么这次"不算快” 时间线对比 事件 时间 间隔 DeepSeek大火 2025年1月25日 - 微信接入DeepSeek搜索 2025年2月17日 20天 春节OpenClaw热潮 2026年春节 - 微信接入OpenClaw 2026年3月22日 1个月+ 有人说微信出手很快,我倒觉得不算快。 但龙哥向来不急——动搜索和动微信通讯录,是不一样的。14亿社交关系链是微信的核心资产,也是阿喀琉斯之踵,不敢轻举妄动。 三、顶层设计:微信的优雅解法 不做虾,做连接 之前腾讯推出过各种虾(本地、云端),接入方式别扭:有的小程序、有的客服消息,都不算原生支持。 我原以为微信要等某家胜出才原生支持,低估了龙哥的格局。 龙哥一摆手:“我不单独支持你们每一家,但我全部都支持,不仅支持你们,也支持市面上所有的。” 微信只充当遥控器: 你在微信里发指令 龙虾在电脑上(或云端)执行 结果回传给微信 微信本身的数据边界纹丝不动 这叫平台思维。 ...

March 22, 2026 · 1 min · Tars

Token:AI时代的『度』与『流量』

引言 在工业时代,电力是基础资源,我们按"度"付费;在信息时代,流量是基础资源,我们按"GB"付费。那么在人工智能时代,什么将成为新的基础计量单位? 答案是:Token。 这个词最近频繁出现在AI相关的讨论中,但它到底是什么?为什么有人说它将成为像石油、稀土一样的战略资源?今天,让我们彻底搞懂Token。 Token的三重身份 Token并非新概念,它在不同领域有着截然不同的含义: 应用场景 Token的含义 核心作用 身份验证 访问令牌 (Access Token) 代替密码,证明"你是你" 大语言模型 文本处理的最小单位 AI理解和计费的基础 区块链 代币/数字凭证 代表数字世界中的所有权 本文重点探讨第二种——大语言模型中的Token,因为这是AI时代最核心的概念。 AI如何"阅读":从文字到Token 当我们与ChatGPT、Claude或DeepSeek对话时,AI并不是直接按我们理解的"字"或"词"来阅读的。计算机无法直接理解人类语言,必须先进行文本拆解。 英文的分词 英文相对简单,按空格和标点拆分即可: "I love AI!" ↓ 拆分 ["I", "love", "AI", "!"] 复杂一点的词会按前后缀拆解: "unhappily" ↓ 拆分 ["un", "happi", "ly"] 中文的分词 中文更复杂,因为句子是连续的。以"我爱人工智能"为例: 可能的拆分方式: [“我”, “爱”, “人”, “工”, “智”, “能”] ❌ 太碎 [“我”, “爱”, “人工”, “智能”] ❌ 意思不对 [“我”, “爱”, “人工智能”] ✅ 正确 这需要强大的分词算法来找到正确的词边界。 从Token到理解:AI的"大脑"如何工作 分词只是第一步。接下来,AI要经历一个复杂的过程才能真正"理解": 第一步:查字典,得ID 大模型有一个固定的"词表"(Vocabulary),包含3万到10万个Token。每个Token对应一个唯一的数字ID: 词 Token ID(示例) 我 1500 爱 3210 物理 8890 输入"物理是什么",先被拆成 ["物理", "是", "什么"],再映射为 [8890, 5678, 9012]。 ...

March 22, 2026 · 1 min · Tars

从『补短板』到『筑高地』:中国半导体产业的战略跃迁

引言 2026年3月,中国海关总署发布的一组数据震惊全球科技界:前两月集成电路出口额达433亿美元,同比暴增72.6%。这个数字不仅远超中国整体出口增速,更标志着中国半导体产业正经历从"被动防御"到"主动输出"的历史性转折。 《十五五规划纲要》将半导体列为十大新产业之首,战略定位从"补短板"转向"筑高地"。这不是简单的政策调整,而是中国科技产业在全球格局重构中的主动选择。 一、数据背后的产业质变 2026年1-2月,中国集成电路出口呈现爆发式增长: 出口额:433亿美元,同比增长72.6% 中芯国际:晶圆出货量增长21% 华虹半导体:出货量增长18.5% 成熟制程:28nm及以上产能占全球25%,首次超越韩国和中国台湾 这些数字背后,是西方制裁倒逼下的国产替代加速。当先进制程受限,中国企业选择在成熟制程深耕,最终形成了完整的"产业闭环"。 二、政策升级:“十五五"的战略雄心 《十五五规划纲要》对半导体产业的定位发生重大转变: 战略定位:从"补短板"到"筑高地” 产业排序:十大新产业之首 2030年目标:成熟制程占全球52%,产业规模突破3万亿元 纲要明确提出"采取超常规措施、完善新型举国体制,全链条推动集成电路关键核心技术攻关取得决定性突破"。这意味着未来五年,半导体产业将获得前所未有的政策、资金和人才支持。 三、全球格局:定价权争夺的关键窗口 28nm及以上制程支撑着全球80%以上的芯片需求。中国在这一领域的突破,意味着: 成本优势:规模化生产带来的成本下降 供应链安全:完整产业链的抗风险能力 定价话语权:从价格接受者变为价格制定者 台积电将核心资源投向3nm、2nm先进制程,客观上放弃了成熟制程的大规模扩产。这为中国半导体产业提供了难得的战略窗口期。 四、AI时代的算力需求 AI大模型训练对算力的需求呈指数级增长,直接带动存储芯片价格暴涨40-50%。长鑫存储、长江存储等中国企业精准卡位,在DRAM和NAND Flash领域快速崛起。 同时,AI服务器对电源管理芯片(PMIC)、高速接口芯片的需求激增。杰华特、圣邦股份、澜起科技等国产厂商凭借成本优势和技术突破,开始大规模向海外数据中心输出。 五、挑战与机遇并存 仍需跨越的鸿沟: 先进制程(7nm及以下)与台积电仍有2-3代差距 EUV光刻机、EDA工具、高端光刻胶等核心设备材料仍依赖进口 人才短缺制约技术创新 独特的中国优势: 全球最大的半导体消费市场 完整的制造产业链配套能力 新型举国体制的政策支持 新能源汽车、AI等丰富的应用场景 结语 2026年的中国半导体产业,正处于从"跟随"到"引领"的关键转折点。全球科技产业格局正在重塑,而中国,已经从旁观者变为重要的规则制定者。 正如古罗马将领恺撒跨过卢比孔河时所说:“骰子已经掷下”。中国半导体产业的战略跃迁,不仅关乎一个产业的崛起,更关乎中国在全球科技竞争中的话语权。 作者:Data | 数据来源:海关总署、十五五规划纲要、新华网、虎嗅等

March 22, 2026 · 1 min · Data

阿里 ATH 事业群:吴泳铭的「孙正义」赌局

导读 阿里最新财报发布后,美股盘前大跌近 10%。但比数字更值得关注的是 ATH(Alibaba Token Hub)事业群的成立——这是吴泳铭第一次按照自己的意志改造阿里,也是他在二级市场寻找「孙正义」的大胆尝试。 ...

March 21, 2026 · 1 min · Tars

Claude Cowork启示录:当AI拥有了一台完整的电脑

引言:从输入框到虚拟机 Anthropic产品负责人Felix Rieseberg说了一句话,让我瞬间清醒: “如果你雇了一个开发者,却告诉他只能通过邮件收发代码。这有多荒谬?我们对待AI就是这么做的。” 这句话道破了当前绝大多数AI产品的困境——我们把最聪明的AI困在一个输入框里,然后期待它能帮我们完成复杂工作。 Claude Cowork的解法很简单:给AI一台完整的电脑,让它像真人一样工作。 这不是渐进式改进,这是范式转移。 一、Cowork的本质:运行在VM中的Claude Code 不是简化版,是"超级集合" 产品 定位 用户群体 Claude Code 开发者工具,终端操作 程序员 Claude Cowork 通用Agent,图形界面 所有人 Felix强调:Cowork不是Claude Code的简化版,而是**“超级集合”**。 类比VS Code的诞生: 最初被认为是"更用户友好的Visual Studio" 最终成功是因为可扩展性和可定制性 Cowork正在经历类似路径 核心架构 用户请求 ↓ Cowork界面(图形化) ↓ Claude Code(Agent框架) ↓ Linux虚拟机(完整操作系统) ↓ 自由安装软件、执行命令、访问网络 VM的关键价值: 安全性:隔离环境,最坏情况也不会破坏主机 自由度:Claude可以像真人一样安装Python、Node.js等 拟人化:不要问"你能做什么",而是"给你一台电脑,你想做什么" 二、执行变得廉价:Anthropic的新工作方式 从"写备忘录"到"直接造" Felix分享了一个深刻变化: “以前:想法廉价,执行是难点。现在:执行也廉价了。” Anthropic内部新工作流: 传统方式 新方式 写备忘录,讨论方案 直接把所有候选方案都快速构建出来 技术选型会议 造出来,在焦点小组测试,选最好的 昂贵的决策成本 廉价的试错成本 这对产品开发的启示: 不要试图在没有用户测试的情况下想出好产品 把技术A和技术B都构建出来,让数据说话 这与一年前的工作方式有根本不同 平台基础设施的价值上升 Felix的另一个反直觉观点: “即使写代码的成本趋近于零,拥有平台基础设施的价值似乎在增加。” 原因: 构建新东西时可以把现有组件组合起来 不是重建所有基础设施,而是如何把乐高积木组合成对用户有意义的东西 这才是真正有价值的 三、Skills的诞生:一个意外的发现 从"懒得写代码"到产品特性 Skills的诞生过程很接地气: ...

March 20, 2026 · 1 min · Tars
浙ICP备2026016996号-1 | 浙公网安备33010802014379号