KAIROS

导语 2026年3月31日，AI圈经历了最戏剧性的一天。 Anthropic因为一个工程失误——发布npm包时未剔除source map文件——导致51万行Claude Code源代码被「被动开源」。短短几小时内，代码被下载、镜像，在GitHub上迅速扩散。但故事远不止于此。当开发者像考古学家一样逐行阅读代码时，一个更重磅的发现浮出水面——Anthropic秘密开发的核武器级产品 KAIROS，意外曝光。前特斯拉AI总监Karpathy第一时间围观并放话：“这就是Claude Claw。” 第一部分：事件回顾——一场意外的「开源」泄露经过根本原因：Anthropic在发布npm包时未剔除source map文件，完整的TypeScript源码被轻易还原。扩散速度：短短几小时内，代码被下载、镜像，GitHub上fork超4万次。官方回应：Anthropic发言人表示「没有涉及敏感客户数据或凭证，属于人为错误导致的发布打包问题」。 Claude Code之父Boris Cherny在X上简单表示：「就是开发者的错误。」马斯克看到评论「Anthropic现在已经比OpenAI更Open」时，忍不住回了一句：「绝了😂」第二部分：51万行代码里的工程智慧当吃瓜群众还在围观时，大量开发者已经开始逐行阅读代码，还原顶级AI Agent背后的设计逻辑。 1. 系统提示词：行为控制的范本完整的system prompt位于constants/prompts.ts，是整个代码库中最有价值的文件。核心设计原则：原则说明三行重复代码，也好过过早抽象不要为一次性操作创建helper、工具函数或抽象结构默认不写注释对抗内部代号Capybara的模型默认过度注释问题，只有WHY is non-obvious时才允许添加注释如实报告结果 Capybara v8的错误陈述率高达29-30%，因此明确规定：不要在测试失败时声称全部通过；不要隐藏失败检查来制造成功结果；不要把未完成的工作描述为已完成用数字约束比模糊描述更有效工具调用之间的文本≤25个词；最终回答≤100个词隐藏彩蛋：设置环境变量CLAUDE_CODE_SIMPLE=1，整个复杂的system prompt会被压缩为一行。 2. 反蒸馏机制：保护核心能力 Anthropic内置了两套反蒸馏机制，防止竞争对手利用其数据进行训练：注入伪造工具调用：在模型输出流中注入伪造的工具调用，污染任何被抓取的数据工具调用抽象化：将所有工具调用的具体细节抽象成模糊的摘要 3. Prompt缓存：极致精细化管理代码库中最复杂的非UI代码之一是promptCacheBreakDetection.ts。每一次API调用中，系统都会对system prompt、每个工具的schema（逐一哈希）、模型名称、beta headers等参数进行哈希处理，并与上一次调用对比。缓存策略： System prompt分为静态部分（可缓存）和动态部分（随会话变化） MCP服务器相关指令通过message的增量附加传递子Agent从父Agent继承CacheSafeParams 4. Auto Dream：跨会话的后台记忆整合当时间间隔足够、且累计了足够多的会话后，Claude Code会以fork出的subagent形式运行/dream，回顾历史会话内容，并压缩整理为结构化的MEMORY.md文件。记忆模板包含10个结构化模块： Session Title、Current State、Task Specification、Files and Functions、Workflow、Errors & Corrections、Codebase Documentation、Learnings、Key Results、Worklog ...

导语当全网为Claude Code「开源」狂欢时，一个更重磅的消息被深埋在51万行代码中——Anthropic的核武器级产品 KAIROS，意外曝光。前特斯拉AI总监Karpathy第一时间围观并放话：“这就是Claude Claw。” 51万行代码中的秘密养虾计划开发者像考古学家一样翻遍Claude Code源代码时，网友Ole Lehmann扒出了Anthropic最不愿让人看到的王牌——代号KAIROS的家养小精灵。 “我真不敢相信，这事儿居然没人讨论！” —— Ole Lehmann 这个发现让Karpathy感慨万千，直呼「知音」。因为这完全就是他预言中AI的下一个进化方向：一个「龙虾版」的Claude Code。 KAIROS：OpenClaw的全方位对标 KAIROS的定位，几乎就是对OpenClaw三大核心能力的全面升级： 1. 主动性：主动出击的「龙虾爪」 KAIROS是一个会主动找你的Claude。你还没开口，它可能突然出现，拍拍你肩膀，告诉你它刚刚干了啥。 24小时后台运行：你工作也好，睡觉也罢，它一直都在心跳机制：每隔几秒收到Prompt——「醒醒，看看现在有啥值得干的活儿没？」自主决策：判断是动手还是继续安静待着一旦决定行动，它能：修代码bug、回消息、更新文件、执行任务……你不用再自己开口。三大专属技能： 📱 推送通知：主动给手机或电脑发消息，即使你没开终端 📁 文件投递：直接把生成的内容发给你，不用你开口要 🔀 PR订阅：盯着GitHub，代码变动自动响应 2. 个性化：会做梦的AI KAIROS每天都会写日报——不是简单的记忆功能，而是详细记录：看到了什么、怎么判断的、做了什么…… 跨会话持续：记录越滚越长，全是追加式，不能删。养得越久，它会越好用。上下文膨胀解决方案：让它做梦晚上，KAIROS会运行autoDream流程，把白天学到的东西整合一遍，重新整理记忆。 “人类的设计太神奇了，谁想过睡觉居然能是一种处理上下文膨胀的巧妙设计。” 3. Skill生态：开箱即用 Anthropic本来就是Skill概念的鼻祖，KAIROS可以直接接入Claude Code已有的生态。场景想象：不睡觉的联合创始人把这些能力结合起来，KAIROS能做到什么？场景 KAIROS行动你睡觉时网站挂了自动检测→重启服务器→通知你，你看到消息时一切已恢复正常凌晨两点收到客户投诉邮件读完→帮你回复→记录全过程，你醒来时事情已经解决这不只是员工，应该是个不睡觉的联合创始人。 Karpathy预言：AI的下一个进化方向早在今年2月，Karpathy就预言：Claw是AI的下一个进化方向。他用一个比喻说明技术栈的演进：层级比喻用户角色 Chat 自己开车全程操控 Code 坐副驾当导航指导+监督 Claw 躺后排睡大觉完全放权自主权越来越高，主动性越来越强。仅仅一个月后，这个预言就得到了印证——而且方式还这么戏剧性。Anthropic本该重金宣传的战略产品，居然因为一个乌龙就这么「随便」地发出来了。后提示词时代已来 AI的下一步已经很明确： ...

KAIROS

Claude Code源码泄露全景分析：从工程失误到KAIROS曝光，Anthropic的'被动开源'事件

Anthropic被逼急了！KAIROS曝光：Claude原生'龙虾'终于浮出水面