DeepSeek变局:当理想主义撞上商业现实

核心洞察 DeepSeek正站在一个关键转折点。这家以"不卷"著称的AI Lab,在R1爆火后经历了核心人才流失、V4延迟发布、以及来自竞争对手的疯狂挖角。但比八卦更重要的是:梁文锋的"理想主义实验"能否在商业化压力下继续? 人才流失:谁在离开,为什么 已确认离职的核心成员 成员 角色 去向 影响 王炳宣 DeepSeek LLM核心作者 腾讯(姚顺雨团队) 历代模型训练骨干 魏浩然 DeepSeek-OCR系列核心 某大厂(待定) 多模态文档理解 郭达雅 DeepSeek-R1核心作者 某大厂(待定) 推理模型核心 阮翀 幻方元老、Janus-Pro核心 元戎启行(自动驾驶) 多模态+端侧AI 离职背后的推力 1. 财富兑现的不确定性 DeepSeek未融资,无明确估值 期权协议价值模糊,而MiniMax、智谱已上市/IPO 竞争对手开出"翻2-3倍"、“8位数总包"的offer 2. 研究方向的错位 DeepSeek专注:效率优化、架构创新、国产生态 行业热点:Agentic应用、Coding、多模态生成 年轻研究员更想参与"最强模型"的署名 3. 算力资源的现实约束 相对Google、OpenAI,GPU资源有限 实验规模和数量受制约 验证"技术品味"的机会成本更高 梁文锋的管理哲学:反共识实验 组织设计:极简扁平 传统AI公司层级: CEO → VP → Director → Manager → Researcher DeepSeek层级: 梁文锋(一号位) ↔ 研究员(100+人) 无明确绩效考核,无DDL(截止时间) 不打卡,多数员工6-7点下班 自然分工,研究员自由组队探索 周会开放,跨组参会无障碍 梁文锋的核心信念 “一个人一天能高质量工作的时间很难超过6-8小时。加班疲劳下的昏庸判断反而会浪费宝贵的算力资源。” 这与行业常态形成鲜明对比: Google、OpenAI、xAI、字节:每周70-80小时 DeepSeek:约大厂1/10人数,1/2人均工时,跻身第一梯队 人才策略:应届生为主 2025年初统计(172名研究者中84人可查): >70% 本科生和硕士生 >70% 年龄小于30岁 几乎不社招,以实习生留任为主 V4模型:延迟背后的技术路线 进展时间线 时间 事件 2026年1月 小参数版V4已给开源框架社区适配 原计划2月中旬 大参数版V4发布(乐观预期) 预计4月 V4可能正式发布 DeepSeek的技术重心(2025年至今) 效率优化方向: ...

April 5, 2026 · 1 min · Tars
浙ICP备2026016996号-1 | 浙公网安备33010802014379号