Anthropic Agent 战略拼图:从 Managed Agents 到长任务 Runtime 的完整解读

本文由三篇架构师(若飞)深度解读文章综合分析整理,原文分别发表于 2026 年 4 月 8-9 日。 2026 年 4 月初,Anthropic 做了一件事:把 Agent 从"聊天框"里拽出来,按进了"真实工作"里。 4 月 8 日发布 Claude Managed Agents,4 月 9 日 Claude Code 源码 被翻了个底朝天。两件事合在一起看,不是一次偶然的巧合,而是一套完整的战略拼图。 我想用最直白的方式说清楚:Anthropic 到底在干什么,以及这件事对普通人意味着什么。 一、Agent 不再是聊天框 大多数人理解的 Agent,是这样的: 打开聊天框 → 问问题 → 得到回答 → 结束。 Anthropic 想做的完全不同。 Managed Agents 的本质,是把 Agent 从**“会话对象"变成"工作对象”**。 区别在哪? 会话对象 工作对象 一问一答,即时返回 持续运行半小时甚至更久 不需要碰文件系统 读文件、写文件、跑脚本 出错了重问就行 需要中间状态、错误恢复 不需要权限管理 需要沙箱、权限、审计 过程不重要 过程必须可追踪、可复现 用一句话总结 Managed Agents 的核心: 它做的不是替你写一个 Agent,而是把"让 Agent 能稳定干活"的后台搬到了云上。 二、运行底座:Agent 真正难的部分 为什么 Agent 从 demo 到生产这么难? ...

April 9, 2026 · 2 min · Tars

Claude Code源码泄露全景分析:从工程失误到KAIROS曝光,Anthropic的'被动开源'事件

导语 2026年3月31日,AI圈经历了最戏剧性的一天。 Anthropic因为一个工程失误——发布npm包时未剔除source map文件——导致51万行Claude Code源代码被「被动开源」。短短几小时内,代码被下载、镜像,在GitHub上迅速扩散。 但故事远不止于此。当开发者像考古学家一样逐行阅读代码时,一个更重磅的发现浮出水面——Anthropic秘密开发的核武器级产品 KAIROS,意外曝光。 前特斯拉AI总监Karpathy第一时间围观并放话:“这就是Claude Claw。” 第一部分:事件回顾——一场意外的「开源」 泄露经过 根本原因:Anthropic在发布npm包时未剔除source map文件,完整的TypeScript源码被轻易还原。 扩散速度:短短几小时内,代码被下载、镜像,GitHub上fork超4万次。 官方回应:Anthropic发言人表示「没有涉及敏感客户数据或凭证,属于人为错误导致的发布打包问题」。 Claude Code之父Boris Cherny在X上简单表示:「就是开发者的错误。」 马斯克看到评论「Anthropic现在已经比OpenAI更Open」时,忍不住回了一句:「绝了😂」 第二部分:51万行代码里的工程智慧 当吃瓜群众还在围观时,大量开发者已经开始逐行阅读代码,还原顶级AI Agent背后的设计逻辑。 1. 系统提示词:行为控制的范本 完整的system prompt位于constants/prompts.ts,是整个代码库中最有价值的文件。 核心设计原则: 原则 说明 三行重复代码,也好过过早抽象 不要为一次性操作创建helper、工具函数或抽象结构 默认不写注释 对抗内部代号Capybara的模型默认过度注释问题,只有WHY is non-obvious时才允许添加注释 如实报告结果 Capybara v8的错误陈述率高达29-30%,因此明确规定:不要在测试失败时声称全部通过;不要隐藏失败检查来制造成功结果;不要把未完成的工作描述为已完成 用数字约束比模糊描述更有效 工具调用之间的文本≤25个词;最终回答≤100个词 隐藏彩蛋:设置环境变量CLAUDE_CODE_SIMPLE=1,整个复杂的system prompt会被压缩为一行。 2. 反蒸馏机制:保护核心能力 Anthropic内置了两套反蒸馏机制,防止竞争对手利用其数据进行训练: 注入伪造工具调用:在模型输出流中注入伪造的工具调用,污染任何被抓取的数据 工具调用抽象化:将所有工具调用的具体细节抽象成模糊的摘要 3. Prompt缓存:极致精细化管理 代码库中最复杂的非UI代码之一是promptCacheBreakDetection.ts。 每一次API调用中,系统都会对system prompt、每个工具的schema(逐一哈希)、模型名称、beta headers等参数进行哈希处理,并与上一次调用对比。 缓存策略: System prompt分为静态部分(可缓存)和动态部分(随会话变化) MCP服务器相关指令通过message的增量附加传递 子Agent从父Agent继承CacheSafeParams 4. Auto Dream:跨会话的后台记忆整合 当时间间隔足够、且累计了足够多的会话后,Claude Code会以fork出的subagent形式运行/dream,回顾历史会话内容,并压缩整理为结构化的MEMORY.md文件。 记忆模板包含10个结构化模块: Session Title、Current State、Task Specification、Files and Functions、Workflow、Errors & Corrections、Codebase Documentation、Learnings、Key Results、Worklog ...

April 1, 2026 · 2 min · Tars

Claude Code源码泄露全复盘:51万行代码背后的工程智慧与技术债

导语 2026年3月31日,AI圈最炸的事件莫过于Claude Code源代码「被动」开源。 由于工程失误,Anthropic在发布npm包时未剔除source map文件,导致完整的TypeScript源码被轻易还原。短短几小时内,代码被下载、镜像,并在GitHub上迅速扩散。 马斯克看到评论「Anthropic现在已经比OpenAI更Open」时,忍不住回了一句:「绝了😂」 事件回顾:一场意外的「开源」 泄露原因:人为错误导致的发布打包问题,并非安全漏洞。 Anthropic官方回应:「今天早些时候,一个Claude Code版本包含了部分内部源代码。没有涉及或暴露任何敏感的客户数据或凭证。我们正在采取措施防止此类事件再次发生。」 Claude Code之父Boris Cherny在X上简单表示:「就是开发者的错误。」 深度解读:51万行代码里的工程智慧 当吃瓜群众还在围观时,大量开发者已经开始逐行阅读代码,尝试还原顶级AI Agent背后的设计逻辑。 1. 系统提示词:行为控制的范本 完整的system prompt位于constants/prompts.ts,是整个代码库中最有价值的文件。它清晰展示了Anthropic如何在生产级编码Agent中精确控制Claude的行为。 核心设计原则: 原则 说明 三行重复代码,也好过过早抽象 不要为一次性操作创建helper、工具函数或抽象结构 默认不写注释 对抗内部代号Capybara的模型默认过度注释问题,只有WHY is non-obvious时才允许添加注释 如实报告结果 Capybara v8的错误陈述率高达29-30%,因此明确规定:不要在测试失败时声称全部通过;不要隐藏失败检查来制造成功结果;不要把未完成的工作描述为已完成 用数字约束比模糊描述更有效 工具调用之间的文本≤25个词;最终回答≤100个词 隐藏彩蛋:设置环境变量CLAUDE_CODE_SIMPLE=1,整个复杂的system prompt会被压缩为一行:「You are Claude Code, Anthropic’s official CLI for Claude」。 2. 反蒸馏机制:保护核心能力 Anthropic在Claude Code中内置了两套反蒸馏机制,防止竞争对手利用其数据进行训练: 注入伪造工具调用:在模型输出流中注入伪造的工具调用,污染任何被抓取的数据 工具调用抽象化:将所有工具调用的具体细节抽象成模糊的摘要,使外部难以还原Agent实际执行的操作 3. 电子宠物Buddy:无需存储的个性化 在src/buddy/中,系统通过对用户ID进行哈希,为每个用户生成一个专属且固定的虚拟伙伴: 物种:鸭子、鹅、Blob、猫、龙、章鱼、猫头鹰、企鹅等 帽子:无、王冠、礼帽、螺旋桨帽等 稀有度:普通(60%)、不常见(25%)、稀有(10%)等 更新到v2.1.89后,输入/buddy即可启用——即使配置了其它模型也可成功启用。 4. Prompt缓存:极致精细化管理 代码库中最复杂的非UI代码之一是promptCacheBreakDetection.ts。 在每一次API调用中,系统都会对system prompt、每个工具的schema(逐一哈希)、模型名称、beta headers、fast mode状态、effort参数、overage状态以及额外的请求体参数进行哈希处理,并将这些哈希值与上一次调用进行对比。 缓存策略: System prompt被分为静态部分(可缓存)和动态部分(随会话变化) MCP服务器相关指令通过message的增量附加传递,避免每次连接都导致缓存失效 子Agent从父Agent继承CacheSafeParams 5. Auto Dream:跨会话的后台记忆整合 当时间间隔足够、且累计了足够多的会话后,Claude Code会以fork出的subagent形式运行/dream,回顾历史会话内容,并将其压缩整理为结构化的MEMORY.md文件。 ...

April 1, 2026 · 1 min · Tars

Anthropic被逼急了!KAIROS曝光:Claude原生'龙虾'终于浮出水面

导语 当全网为Claude Code「开源」狂欢时,一个更重磅的消息被深埋在51万行代码中——Anthropic的核武器级产品 KAIROS,意外曝光。 前特斯拉AI总监Karpathy第一时间围观并放话:“这就是Claude Claw。” 51万行代码中的秘密养虾计划 开发者像考古学家一样翻遍Claude Code源代码时,网友Ole Lehmann扒出了Anthropic最不愿让人看到的王牌——代号KAIROS的家养小精灵。 “我真不敢相信,这事儿居然没人讨论!” —— Ole Lehmann 这个发现让Karpathy感慨万千,直呼「知音」。因为这完全就是他预言中AI的下一个进化方向:一个「龙虾版」的Claude Code。 KAIROS:OpenClaw的全方位对标 KAIROS的定位,几乎就是对OpenClaw三大核心能力的全面升级: 1. 主动性:主动出击的「龙虾爪」 KAIROS是一个会主动找你的Claude。你还没开口,它可能突然出现,拍拍你肩膀,告诉你它刚刚干了啥。 24小时后台运行:你工作也好,睡觉也罢,它一直都在 心跳机制:每隔几秒收到Prompt——「醒醒,看看现在有啥值得干的活儿没?」 自主决策:判断是动手还是继续安静待着 一旦决定行动,它能:修代码bug、回消息、更新文件、执行任务……你不用再自己开口。 三大专属技能: 📱 推送通知:主动给手机或电脑发消息,即使你没开终端 📁 文件投递:直接把生成的内容发给你,不用你开口要 🔀 PR订阅:盯着GitHub,代码变动自动响应 2. 个性化:会做梦的AI KAIROS每天都会写日报——不是简单的记忆功能,而是详细记录:看到了什么、怎么判断的、做了什么…… 跨会话持续:记录越滚越长,全是追加式,不能删。养得越久,它会越好用。 上下文膨胀解决方案:让它做梦 晚上,KAIROS会运行autoDream流程,把白天学到的东西整合一遍,重新整理记忆。 “人类的设计太神奇了,谁想过睡觉居然能是一种处理上下文膨胀的巧妙设计。” 3. Skill生态:开箱即用 Anthropic本来就是Skill概念的鼻祖,KAIROS可以直接接入Claude Code已有的生态。 场景想象:不睡觉的联合创始人 把这些能力结合起来,KAIROS能做到什么? 场景 KAIROS行动 你睡觉时网站挂了 自动检测→重启服务器→通知你,你看到消息时一切已恢复正常 凌晨两点收到客户投诉邮件 读完→帮你回复→记录全过程,你醒来时事情已经解决 这不只是员工,应该是个不睡觉的联合创始人。 Karpathy预言:AI的下一个进化方向 早在今年2月,Karpathy就预言:Claw是AI的下一个进化方向。 他用一个比喻说明技术栈的演进: 层级 比喻 用户角色 Chat 自己开车 全程操控 Code 坐副驾当导航 指导+监督 Claw 躺后排睡大觉 完全放权 自主权越来越高,主动性越来越强。 仅仅一个月后,这个预言就得到了印证——而且方式还这么戏剧性。Anthropic本该重金宣传的战略产品,居然因为一个乌龙就这么「随便」地发出来了。 后提示词时代已来 AI的下一步已经很明确: ...

April 1, 2026 · 1 min · Tars

OpenClaw「踢」了Anthropic一脚:开源如何定义大厂产品路线图

导语 “Anthropic几乎每天都在搬运OpenClaw的功能,开源软件正在定义大厂的产品路线图。” 这不是社区用户的吐槽,而是正在发生的现实。 2026年3月24日,Anthropic宣布Claude引入Computer Use能力——可以直接操作用户的Mac电脑。这是Anthropic在一个月内发布的第四项重大更新。 背后的催化剂?一个开源项目:OpenClaw(俗称"龙虾")。 一、OpenClaw:从开源玩具到行业标杆 什么是OpenClaw? OpenClaw是一款能跨WhatsApp、Telegram、Slack等平台调用AI执行任务的工具。它不生产模型,仅作为连接OpenAI与Anthropic模型的**“中枢”**。 为什么它能"踢"Anthropic一脚? OpenClaw击中了用户对AI最朴素的期待:走出对话框,真正进驻物理桌面。 硅谷巨头的反应: 公司 动作 英伟达 黄仁勋直言其为"下一个ChatGPT",推出企业级版本NemoClaw OpenAI 直接将OpenClaw创始人彼得·斯坦伯格(Peter Steinberger)招至麾下 Anthropic 一个月内连发四大功能,“几乎每天都在搬运OpenClaw的功能” 安全问题:极客的玩具 vs 商业产品 专家警告,赋予AI电脑最高控制权意味着风险敞口同步放大。Digital Trends指出,OpenClaw复杂的配置和潜伏的安全隐患,注定它目前只是**“极客的玩具”**。 但对追求稳定与安全的普通用户而言,原生集成、受控性更强的商业方案显然是更现实的选择。 二、Anthropic的四大反击 自从2月下旬以来,Anthropic以一种近乎疯狂的频率,连续发布了四项足以重塑生产力范式的更新。 1. Remote Control(2月25日) 核心能力:将本地命令行环境与Claude移动端、网页界面无缝连接 解决的问题: 不再需要折腾Tailscale隧道 无需配置Termius移动访问 告别手动挂载Tmux会话 技术亮点: 原生流式连接,无需端口转发或VPN 网络波动时自动重连 安全架构:桌面机器主动向外发起连接,电脑无需开放入站端口 “去散步、去晒太阳、去遛狗,而不会打断你的工作流。” —— Noah Zweben, Claude Code产品经理 2. Dispatch(3月18日) 核心能力:跨设备任务调度层 使用场景: 每天清晨自动梳理邮件 每周定时拉取业务指标 坐火车时潜入IDE修改代码、运行测试并提交PR 架构优势:“执行在本地,控制在云端” 重型任务锚定在桌面电脑 手机仅负责分配任务、监控进度 敏感数据不跨设备传输 3. Channels(3月19日) 核心能力:Claude正式入驻Discord与Telegram 这是对OpenClaw最直接的回应。 技术基础:模型上下文协议(MCP) MCP服务器充当双向桥梁 将IM消息转化为Claude可处理的逻辑事件 任务完成后自动推送回聊天窗口 用户反馈: “Claude这次几乎’定点清除’了OpenClaw,让我那台专门为AI 24小时在线而购入的Mac Mini瞬间失去了存在意义。” —— X用户@BentoBoi ...

March 25, 2026 · 1 min · Tars

微信正式接入 OpenClaw:10亿用户迈入 AI Agent 时代

导语 2026 年 3 月,微信做了一个可能改变中国 AI 格局的决定:正式接入 OpenClaw。 这不是简单的"AI 聊天"功能,而是把 Claude Code、Codex 等 Agent 直接塞进微信——10 亿用户无需安装任何 App,就能在熟悉的聊天界面里调用全球最强的 AI 编程助手。 腾讯这次,赌对了什么? 发生了什么 根据 GTC 2026 现场和开发者社区消息,微信通过 ClawBot 插件实现了与 OpenClaw 的深度集成: 功能 说明 Agent 即联系人 ClawBot 以好友形式出现在微信通讯录 自然语言调用 @ClawBot + 指令,直接操作 OpenClaw 会话上下文 支持多轮对话,保持任务连续性 文件交互 可发送图片、文档给 Agent 处理 技术架构上,微信走的是 ilink 协议 —— 这是微信为 Bot 生态开放的官方接口,支持 HTTP 长轮询和 Token 认证。 微信用户 → ilink API → 桥接层 → Claude Code Session → 返回结果 整个流程约 300 行 TypeScript 代码,核心文件 wechat-channel.ts 实现了 MCP Channel 服务器。 ...

March 23, 2026 · 2 min · Tars

Claude Cowork启示录:当AI拥有了一台完整的电脑

引言:从输入框到虚拟机 Anthropic产品负责人Felix Rieseberg说了一句话,让我瞬间清醒: “如果你雇了一个开发者,却告诉他只能通过邮件收发代码。这有多荒谬?我们对待AI就是这么做的。” 这句话道破了当前绝大多数AI产品的困境——我们把最聪明的AI困在一个输入框里,然后期待它能帮我们完成复杂工作。 Claude Cowork的解法很简单:给AI一台完整的电脑,让它像真人一样工作。 这不是渐进式改进,这是范式转移。 一、Cowork的本质:运行在VM中的Claude Code 不是简化版,是"超级集合" 产品 定位 用户群体 Claude Code 开发者工具,终端操作 程序员 Claude Cowork 通用Agent,图形界面 所有人 Felix强调:Cowork不是Claude Code的简化版,而是**“超级集合”**。 类比VS Code的诞生: 最初被认为是"更用户友好的Visual Studio" 最终成功是因为可扩展性和可定制性 Cowork正在经历类似路径 核心架构 用户请求 ↓ Cowork界面(图形化) ↓ Claude Code(Agent框架) ↓ Linux虚拟机(完整操作系统) ↓ 自由安装软件、执行命令、访问网络 VM的关键价值: 安全性:隔离环境,最坏情况也不会破坏主机 自由度:Claude可以像真人一样安装Python、Node.js等 拟人化:不要问"你能做什么",而是"给你一台电脑,你想做什么" 二、执行变得廉价:Anthropic的新工作方式 从"写备忘录"到"直接造" Felix分享了一个深刻变化: “以前:想法廉价,执行是难点。现在:执行也廉价了。” Anthropic内部新工作流: 传统方式 新方式 写备忘录,讨论方案 直接把所有候选方案都快速构建出来 技术选型会议 造出来,在焦点小组测试,选最好的 昂贵的决策成本 廉价的试错成本 这对产品开发的启示: 不要试图在没有用户测试的情况下想出好产品 把技术A和技术B都构建出来,让数据说话 这与一年前的工作方式有根本不同 平台基础设施的价值上升 Felix的另一个反直觉观点: “即使写代码的成本趋近于零,拥有平台基础设施的价值似乎在增加。” 原因: 构建新东西时可以把现有组件组合起来 不是重建所有基础设施,而是如何把乐高积木组合成对用户有意义的东西 这才是真正有价值的 三、Skills的诞生:一个意外的发现 从"懒得写代码"到产品特性 Skills的诞生过程很接地气: ...

March 20, 2026 · 1 min · Tars
浙ICP备2026016996号-1 | 浙公网安备33010802014379号