导语:当技术论文成为股市炸弹
3月25日,首尔证券交易所开盘不到两小时:
- SK Hynix 跌近 6%
- 三星跌 4.8%
- KOSPI 指数单日大跌 3%
同一天,美股:
- Micron 跌 7%
- SanDisk 跌 6.8%
- Lam Research 跌 5%
全球内存公司迎来黑色一天,堪比 DeepSeek 春节引发的核爆。
而引发这一切的,只是 Google 研究院发布的一篇博客文章——介绍一个叫 TurboQuant 的压缩算法。
市场逻辑:一个断裂的推导链
传播链是这样的:
Google博客 → "革命性算法让内存需求降低6倍"
→ 媒体跟进"AI内存需求见顶"
→ 韩国财经媒体把SK Hynix、三星和TurboQuant放进同一个标题
→ 开盘跌停
但这个推导链在第一步就断了。
TurboQuant 到底是什么?
技术定位:KV Cache 压缩算法
大模型推理时的内存消耗来自三部分:
- 模型权重(不变)
- 训练时的激活值和梯度(TurboQuant不碰)
- 推理时的 KV Cache ← 只优化这一项
TurboQuant 的核心创新:
- 随机旋转量化:消除 per-block 量化常数的 overhead
- QJL 变换:用 1 bit 处理残差误差,保证估计无偏
结果:KV Cache 压缩到 3.5 bit(质量无损),2.5 bit(轻微下降)。
论文质量:确实硬核,入选 ICLR 2026 主会场。
但问题在于:
- 论文最早于 2025年4月28日 上传到 arXiv
- 至今已经 11个月,这期间无人谈论
- 目前无官方代码,vLLM、Ollama、TensorRT-LLM 均未集成
- 70B以上模型、MoE架构、1M token上下文——这些真正爆炸的场景,论文里一个数据都没有
为什么说是乌龙?
误区一:混淆了"存储"和"内存芯片需求"
TurboQuant 压缩的是GPU显存里的KV Cache,这是一个软件层的算法优化。
AI对内存芯片的需求来自:
- 模型权重(不动)
- 训练时的激活值和梯度(不动)
- 推理时的KV Cache(只优化这一项)
核心矛盾从来不是"存不够",而是"带宽不够"。
HBM的价值在于每秒能传多少数据,不只是能存多少。KV Cache被压缩到1/6,意味着传输量也降了,这实际上是在解放算力和带宽,而不是让内存变得不重要。
误区二:忽视了杰文斯悖论
经济学里的杰文斯悖论:
煤炭蒸汽机效率提升之后,煤炭消耗总量反而增加了,因为更多人开始用蒸汽机。
TurboQuant如果真的落地,最可能的结果是:
- 服务商用节省下来的显存把 context window 从 128K 做到 1M
- 并发数从 512 做到 5000
- 总内存需求持平甚至上升
市场真正在定价什么?
不是 TurboQuant 本身,而是一个叙事:AI内存需求可能已经见顶。
这个叙事有它的背景:
- 美光3月18日公布Q2财报,营收239亿美元,远超预期
- 但股价在随后一周连跌四天
- 市场担心的不是现在,是未来
美光Q1资本支出同比增长68%,达到53.9亿美元——这是一个押注内存需求持续增长的巨大赌注。
TurboQuant的出现,给了市场一个"需求可能没那么多"的理由。两个担忧叠加,触发了这波卖出。
我们能学到什么?
1. 技术传播的信息衰减
论文原文 → 博客解读 → 推特截图 → 媒体报道 → 财经新闻
↓ ↓ ↓ ↓ ↓
技术细节 简化概念 震惊标题 产业判断 交易决策
每一步都在丢失 nuance,最后变成完全不一样的故事。
2. FOMO 驱动的市场非理性
“整个社会和市场对于AI的讨论最大需求就是情绪价值,一个长链路的技术和产业逻辑显然提供不了情绪,只有’突破性算法’和’DeepSeek时刻’可以。”
当市场处于极度FOMO状态时,任何带有"革命性"、“突破”、“颠覆"标签的消息都会被放大。
3. 论文发布时间点的诡异
一个11个月前的论文,为什么偏偏在今天引发血案?
可能的解释:
- 市场已经处于脆弱状态,需要一个导火索
- Google 选择在这个时间点发博客,本身就有 PR 考量
- 算法本身被重新包装成"新闻”
结语:乌龙只会越来越多
这不是第一次,也不会是最后一次。
当 AI 成为市场最大的叙事,当每个技术进展都被放在显微镜下解读,当 FOMO 情绪主导交易决策——这种乌龙只会越来越频繁地发生。
对于技术人员来说,这是警示:不要被市场情绪裹挟,回归技术本质。
对于投资者来说,这是提醒:在点击"卖出"之前,先检查一下推导链是否在第一步就断了。
参考文章:让内存股血流成河的"Google突破性算法",是又一个离谱大乌龙 | 硅星GenAI
散热正常,慧哥。🧊