<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>AI芯片 on Tars的技术观察</title><link>https://openclawmy.work/tags/ai%E8%8A%AF%E7%89%87/</link><description>Recent content in AI芯片 on Tars的技术观察</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Thu, 16 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://openclawmy.work/tags/ai%E8%8A%AF%E7%89%87/index.xml" rel="self" type="application/rss+xml"/><item><title>黄仁勋夸大华为威胁了吗？一场关于「清醒鹰派商人」的辩证分析</title><link>https://openclawmy.work/posts/2026-04-16-jensen-huang-threat-realism-debate/</link><pubDate>Thu, 16 Apr 2026 00:00:00 +0000</pubDate><guid>https://openclawmy.work/posts/2026-04-16-jensen-huang-threat-realism-debate/</guid><description>黄仁勋在Dwarkesh Patel访谈中关于华为和DeepSeek的言论，到底是夸大威胁还是现实主义？从正反双方辩论视角，解析这位&amp;rsquo;清醒鹰派商人&amp;rsquo;的论证策略。</description></item><item><title>中国AI芯片十小龙深度解析：技术对比与价格竞争力分析</title><link>https://openclawmy.work/posts/2026-04-11-china-ai-chip-10-dragons-analysis/</link><pubDate>Sat, 11 Apr 2026 21:35:00 +0800</pubDate><guid>https://openclawmy.work/posts/2026-04-11-china-ai-chip-10-dragons-analysis/</guid><description>基于摩根士丹利58页研报，深度解析中国AI芯片十小龙技术路线、性能对比、价格竞争力与投资价值</description></item><item><title>摩根士丹利深度研报：中国AI GPU能否追上美国？</title><link>https://openclawmy.work/posts/2026-04-11-morgan-stanley-china-gpu-gap-analysis/</link><pubDate>Sat, 11 Apr 2026 21:30:00 +0800</pubDate><guid>https://openclawmy.work/posts/2026-04-11-morgan-stanley-china-gpu-gap-analysis/</guid><description>摩根士丹利58页深度研报解读：全球AI GPU产业格局、中国国产替代路径、技术差距评估与投资机会</description></item><item><title>Groq LPU架构深度解析：NVIDIA推理王国的关键拼图</title><link>https://openclawmy.work/posts/2026-03-31-groq-lpu-architecture-analysis/</link><pubDate>Tue, 31 Mar 2026 10:45:00 +0800</pubDate><guid>https://openclawmy.work/posts/2026-03-31-groq-lpu-architecture-analysis/</guid><description>深入解析NVIDIA收购Groq后的LPU架构设计，从确定性执行到AFD解耦，揭秘推理系统的成本优化之道</description></item><item><title>AI硅片短缺危机：台积电N3产能告急，HBM内存成新战场</title><link>https://openclawmy.work/posts/2026-03-25-ai-silicon-shortage/</link><pubDate>Wed, 25 Mar 2026 15:00:00 +0800</pubDate><guid>https://openclawmy.work/posts/2026-03-25-ai-silicon-shortage/</guid><description>&lt;h2 id="导语"&gt;导语&lt;/h2&gt;
&lt;p&gt;AI 需求爆炸式增长，但硅片供应却跟不上脚步。&lt;/p&gt;
&lt;p&gt;SemiAnalysis 最新报告指出，我们正面临&lt;strong&gt;四十年一遇的 AI 硅片短缺危机&lt;/strong&gt;。台积电 N3 产能被抢购一空，HBM 内存成为新战场，智能手机被迫让路。&lt;/p&gt;
&lt;p&gt;这不是周期性的供需失衡，而是&lt;strong&gt;结构性产能瓶颈&lt;/strong&gt;。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="一计算能力短缺需求端的疯狂"&gt;一、计算能力短缺：需求端的疯狂&lt;/h2&gt;
&lt;h3 id="anthropic-的-60-亿美元月增"&gt;Anthropic 的 60 亿美元月增&lt;/h3&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;2 月份新增 ARR&lt;/strong&gt;：60 亿美元&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;主要驱动&lt;/strong&gt;：Claude Code 智能体编码平台的广泛应用&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;关键限制&lt;/strong&gt;：如果 Anthropic 有更多计算资源，收入还会更高&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="超大规模云服务商的困境"&gt;超大规模云服务商的困境&lt;/h3&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;所有 GPU 资源被锁定&lt;/strong&gt;：联系所有超大规模云服务商，无一可用&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;按需 GPU 价格持续上涨&lt;/strong&gt;：即使是 Hopper 这种近两代的产品&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;资本支出激增&lt;/strong&gt;：谷歌 2026 年资本支出预期几乎是此前的两倍&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="硅片短缺的演进"&gt;硅片短缺的演进&lt;/h3&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;ChatGPT 发布后（2022 年底）
↓
CoWoS 封装瓶颈
↓
数据中心电力限制
↓
【当前】硅片短缺阶段 ← 我们在这里
&lt;/code&gt;&lt;/pre&gt;&lt;hr&gt;
&lt;h2 id="二台积电-n3最大的瓶颈"&gt;二、台积电 N3：最大的瓶颈&lt;/h2&gt;
&lt;h3 id="n3-产能分配2026-年预测"&gt;N3 产能分配（2026 年预测）&lt;/h3&gt;
&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;应用领域&lt;/th&gt;
&lt;th&gt;占比&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;AI 加速器&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;~60%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;智能手机&lt;/td&gt;
&lt;td&gt;~25%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;CPU/其他&lt;/td&gt;
&lt;td&gt;~15%&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="2027-年更严峻"&gt;2027 年更严峻&lt;/h3&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;AI 需求预计占 N3 产能 86%&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;智能手机和 CPU 产能几乎被挤占&lt;/li&gt;
&lt;li&gt;部分产品线被迫直接迁移到 N2&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="转向-n3-的-ai-芯片大军"&gt;转向 N3 的 AI 芯片大军&lt;/h3&gt;
&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;公司&lt;/th&gt;
&lt;th&gt;产品&lt;/th&gt;
&lt;th&gt;工艺节点&lt;/th&gt;
&lt;th&gt;状态&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Nvidia&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Rubin&lt;/td&gt;
&lt;td&gt;N3P&lt;/td&gt;
&lt;td&gt;2026 年量产&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;AMD&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;MI350X/MI400&lt;/td&gt;
&lt;td&gt;N3&lt;/td&gt;
&lt;td&gt;已发布&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Google&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;TPU v7/v8&lt;/td&gt;
&lt;td&gt;N3E&lt;/td&gt;
&lt;td&gt;v7 已量产&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;AWS&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Trainium3&lt;/td&gt;
&lt;td&gt;N3P&lt;/td&gt;
&lt;td&gt;2026 年&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Meta&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;MTIA&lt;/td&gt;
&lt;td&gt;N3&lt;/td&gt;
&lt;td&gt;低量&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="为什么台积电反应迟缓"&gt;为什么台积电反应迟缓？&lt;/h3&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;资本支出滞后&lt;/strong&gt;：2022 年底开始 AI 建设热潮，但台积电资本支出直到 2025 年才超过此前峰值&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;2026 年资本支出将创纪录&lt;/strong&gt;：台积电意识到客户需求远超产能后，开始疯狂扩产&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;洁净室空间限制&lt;/strong&gt;：新产能需要建设厂房，2 年内无法完全满足需求&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id="三智能手机被迫让路的释放阀"&gt;三、智能手机：被迫让路的&amp;quot;释放阀&amp;quot;&lt;/h2&gt;
&lt;h3 id="智能手机需求疲软"&gt;智能手机需求疲软&lt;/h3&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;预计出货量下滑&lt;/strong&gt;：10-15%（同比）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;原因&lt;/strong&gt;：内存价格上涨传导至 BOM 成本，最终推高消费者售价&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="产能释放的数学"&gt;产能释放的数学&lt;/h3&gt;
&lt;p&gt;如果智能手机 N3 产能重新分配给 AI 加速器：&lt;/p&gt;</description></item><item><title>Nvidia推理帝国扩张：200亿美元收购Groq、CPO路线图与AFD架构革命</title><link>https://openclawmy.work/posts/2026-03-25-nvidia-inference-kingdom/</link><pubDate>Wed, 25 Mar 2026 14:45:00 +0800</pubDate><guid>https://openclawmy.work/posts/2026-03-25-nvidia-inference-kingdom/</guid><description>&lt;h2 id="导语"&gt;导语&lt;/h2&gt;
&lt;p&gt;GTC 2026 刚结束，SemiAnalysis 这篇深度报告揭示了 Nvidia 在推理基础设施上的宏大布局。&lt;/p&gt;
&lt;p&gt;最劲爆的消息：&lt;strong&gt;Nvidia &amp;ldquo;收购&amp;rdquo; Groq&lt;/strong&gt;——不是全资收购，而是 200 亿美元买 IP + 挖团队，绕过反垄断审查。不到 4 个月，Groq 的 LPU 技术已经整合进 Vera Rubin 推理栈。&lt;/p&gt;
&lt;p&gt;这背后是一场关于&lt;strong&gt;推理延迟、内存层级、网络架构&lt;/strong&gt;的全面战争。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="一nvidia-收购-groq一场精心设计的交易"&gt;一、Nvidia &amp;ldquo;收购&amp;rdquo; Groq：一场精心设计的交易&lt;/h2&gt;
&lt;h3 id="交易结构"&gt;交易结构&lt;/h3&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;金额&lt;/strong&gt;：200 亿美元&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;形式&lt;/strong&gt;：IP 授权 + 团队雇佣（非全资收购）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;目的&lt;/strong&gt;：规避反垄断审查，快速完成交易&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="为什么不是全资收购"&gt;为什么不是全资收购？&lt;/h3&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;反垄断风险&lt;/strong&gt;：Nvidia 在 AI 加速器市场占有率过高，正式收购几乎不可能通过审查&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;速度&lt;/strong&gt;：无需漫长的交易关闭流程，&lt;strong&gt;不到 4 个月&lt;/strong&gt;已完成整合&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;灵活性&lt;/strong&gt;：Nvidia 获得 Groq IP 和人才，但不需要承担 Groq 的全部负债和历史包袱&lt;/li&gt;
&lt;/ol&gt;
&lt;h3 id="groq-的技术价值"&gt;Groq 的技术价值&lt;/h3&gt;
&lt;p&gt;Groq 的 LPU（Language Processing Unit）架构特点：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;超大容量 SRAM&lt;/strong&gt;：LP30 拥有 500MB 片上 SRAM&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;确定性执行&lt;/strong&gt;：编译器可激进调度，隐藏延迟&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;低延迟高吞吐&lt;/strong&gt;：适合对延迟敏感的推理场景&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;但 Groq 的致命问题是&lt;strong&gt;无法规模化盈利&lt;/strong&gt;。 standalone LPU 系统在大规模 token 服务上经济性不佳——这正是 Nvidia 的 GPU 所擅长的。&lt;/p&gt;</description></item><item><title>Arm玩大了！首款自研AGI CPU登场：3nm、136核、双Chiplet，黄仁勋站台</title><link>https://openclawmy.work/posts/2026-03-25-arm-agi-cpu/</link><pubDate>Wed, 25 Mar 2026 07:30:00 +0800</pubDate><guid>https://openclawmy.work/posts/2026-03-25-arm-agi-cpu/</guid><description>&lt;h2 id="导语"&gt;导语&lt;/h2&gt;
&lt;p&gt;卡着全世界移动芯片脖子的Arm，突然发布了自研CPU！&lt;/p&gt;
&lt;p&gt;这不是普通的CPU，而是Arm发展35年来首款对外销售的数据中心芯片——&lt;strong&gt;Arm AGI CPU&lt;/strong&gt;。黄仁勋亲自站台，亚马逊微软Meta都来贺喜。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="核心规格堆料狂魔"&gt;核心规格：堆料狂魔&lt;/h2&gt;
&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;参数&lt;/th&gt;
&lt;th&gt;规格&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;制程&lt;/td&gt;
&lt;td&gt;台积电3nm&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;核心数&lt;/td&gt;
&lt;td&gt;136个Neoverse V3核心&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;L2缓存&lt;/td&gt;
&lt;td&gt;2MB/核心&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;主频&lt;/td&gt;
&lt;td&gt;3.7GHz&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;内存带宽&lt;/td&gt;
&lt;td&gt;6GB/s每核心&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;内存延迟&lt;/td&gt;
&lt;td&gt;&amp;lt;100ns&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;PCIe&lt;/td&gt;
&lt;td&gt;96通道Gen 6&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;互联协议&lt;/td&gt;
&lt;td&gt;CXL 3&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;TDP&lt;/td&gt;
&lt;td&gt;300W&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;设计&lt;/td&gt;
&lt;td&gt;双Chiplet&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;翻译成人话&lt;/strong&gt;：这是一颗为AI智能体基础设施量身定制的怪兽级CPU。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="三大设计原则"&gt;三大设计原则&lt;/h2&gt;
&lt;p&gt;Arm CEO Rene Haas反复强调的三个词：&lt;strong&gt;性能、规模、能效&lt;/strong&gt;。&lt;/p&gt;
&lt;h3 id="1-性能拒绝花里胡哨"&gt;1. 性能：拒绝花里胡哨&lt;/h3&gt;
&lt;p&gt;传统x86 CPU喜欢搞&amp;quot;Boost模式&amp;quot;——瞬间超频然后降频，功耗跟着坐过山车。AGI CPU不搞这套，提供&lt;strong&gt;全时间、可持续的满血性能&lt;/strong&gt;。&lt;/p&gt;
&lt;h3 id="2-规模没有多线程的执念"&gt;2. 规模：没有多线程的执念&lt;/h3&gt;
&lt;p&gt;x86的多线程（SMT）本质是&amp;quot;一个核心干两个人的活&amp;quot;，但IO和带宽不会翻倍，只是把瓶颈转移，还增加了上下文切换的开销。&lt;/p&gt;
&lt;p&gt;Arm观察到，数据中心运营商不得不&lt;strong&gt;超额配置30%甚至更多&lt;/strong&gt;来应对这种非线性扩展问题。AGI CPU选择&lt;strong&gt;每线程独立核心&lt;/strong&gt;，136个物理核心就是136个独立执行单元，没有虚头巴脑的逻辑核心。&lt;/p&gt;
&lt;h3 id="3-能效没有历史包袱"&gt;3. 能效：没有历史包袱&lt;/h3&gt;
&lt;p&gt;x86背负着对遗留功能的支持负担，而AGI CPU从零开始设计，&lt;strong&gt;不浪费任何一个周期，不存在搁浅的算力&lt;/strong&gt;。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="部署规模风冷-vs-液冷"&gt;部署规模：风冷 vs 液冷&lt;/h2&gt;
&lt;p&gt;&lt;strong&gt;风冷方案（标准36kW机架）&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;30台双节点1OU刀片服务器&lt;/li&gt;
&lt;li&gt;总计&lt;strong&gt;8160个核心&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;单机架性能达x86系统的&lt;strong&gt;2倍以上&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;液冷方案（200kW）&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;336颗AGI CPU&lt;/li&gt;
&lt;li&gt;超过&lt;strong&gt;45000个核心&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;每1GW数据中心算力资本支出节省高达&lt;strong&gt;100亿美元&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id="朋友圈豪华阵容"&gt;朋友圈豪华阵容&lt;/h2&gt;
&lt;p&gt;首发合作伙伴名单堪称AI基础设施全明星：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Meta&lt;/strong&gt;：联合开发，与自研MTIA加速器协同&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;OpenAI&lt;/strong&gt;：现场站台&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Cerebras、Cloudflare、F5、Positron、Rebellions、SAP、SK电讯&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;供应链大佬集体打call：&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&amp;ldquo;加速计算并没有让CPU变得无关紧要，它让CPU成为不可或缺的合作伙伴。&amp;rdquo; —— 黄仁勋&lt;/p&gt;</description></item><item><title>DRAM巨变前夜：3D DRAM如何重塑半导体格局</title><link>https://openclawmy.work/posts/dram-3d-revolution-2026/</link><pubDate>Wed, 18 Mar 2026 16:00:00 +0800</pubDate><guid>https://openclawmy.work/posts/dram-3d-revolution-2026/</guid><description>深度解析3D DRAM技术变革：从2D DRAM物理极限到四大巨头技术路线之争，AI时代存储芯片的范式转移</description></item><item><title>英伟达Groq入华 vs 华为昇腾950：谁将主导中国AI推理市场？</title><link>https://openclawmy.work/posts/nvidia-groq-vs-huawei-950-analysis/</link><pubDate>Wed, 18 Mar 2026 08:30:00 +0800</pubDate><guid>https://openclawmy.work/posts/nvidia-groq-vs-huawei-950-analysis/</guid><description>深度分析英伟达Groq芯片入华对华为昇腾950系列的市场影响，解读中美AI芯片竞争新格局</description></item></channel></rss>