又走一个，OpenAI研究VP离职，转投Anthropic做RL研究员 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

又走一个，OpenAI研究VP离职，转投Anthropic做RL研究员

8 小时前 / 阅读约7分钟

来源：36kr

OpenAI前研究副总裁Max Schwarzer宣布离职，转投Anthropic，理由是渴望回归一线IC研究工作。他在OpenAI主导post-training团队，参与训练多个重要模型。他的离职反映了AI行业内部因价值观而产生的深刻分裂。

心态崩了！OpenAI又走了一个重量级人物。

刚刚，前研究副总裁Max Schwarzer在X上发文，宣布正式离开OpenAI，转投Anthropic。

他在OpenAI主导整个post-training团队，亲手参与训练了o1、o3，以及GPT-5、5.1、5.2、5.3-Codex全系列模型。

但他不是被挖走的，是自己主动选择走的，理由是「渴望回归一线IC研究工作」。

这个选择，比离职本身更耐人寻味。

他亲历了o1的诞生

在AI圈，Max Schwarzer算不上家喻户晓，但他的履历相当拿得出手。

2024年3月，他在蒙特利尔人工智能研究院Mila完成博士答辩，导师是强化学习领域的两位重量级人物：Aaron Courville和Marc Bellemare。

博士期间，他的研究聚焦在「规模化与样本高效强化学习」的交叉地带。

通俗来说，就是怎么让RL训练既强又省。

他在2023年ICML发表的论文拿下了当年的顶会奖项，证明了不依赖LLM或世界模型，纯靠扩展无模型RL就能达到人类水平的样本效率。

论文传送门：https://arxiv.org/abs/2305.19452

但真正让他进入OpenAI核心圈的，是他对推理的判断。

2024年9月12日，o1-preview发布当天，他发帖说这是「推理时代的开端」。

他是OpenAI o1的核心贡献者之一，参与了「草莓团队」（Strawberry team）的RL算法开发，o1-preview的早期去风险化实验更是出自他手。

之后，他主导了o1和o3的post-training，2025年3月晋升为研究副总裁，领导整个post-training团队，负责打磨GPT-5系列。

从应届博士生入职，他用不到两年半时间就坐上了研究VP的位置。

顶级VP：我只想回去做研究

离职声明里都是对OpenAI的称赞：「OpenAI有我见过的最有才华的一批研究员」「我学到的东西超出了我作为应届毕业生时的想象」。

关于离职的真正的理由，他说：

领导了一年的post-training工作之后，我渴望重新出发，回到IC研究岗位。我一直在认真考虑回归技术研究这件事，而且我真心相信，我的同事和团队在没有我的情况下完全能够继续成功。

这句话值得细品。

IC研究，相对于管理角色来说，就是亲手写代码、跑实验；管理层负责管人、协调资源、做路线规划。

对研究员来说，升得越高，离真正的研究越远。

Schwarzer显然不适应这种状态。

他在OpenAI的最后一年，更多时间花在带团队、做决策上。

站在研究VP的位置上，他可以影响几十人的研究方向，但自己动手的空间少了很多。

这种选择在AI行业并不罕见，但肯做出这个选择的人需要勇气。

毕竟，「研究VP」的头衔在任何简历上都足够好看，放弃它回去当普通研究员，不是每个人都愿意的。

事实上，Schwarzer不是第一个从post-training主管位置出走的人。

他的前任Liam Fedus，同样担任过OpenAI研究副总裁兼post-training负责人，于2025年3月离职，随后联合创办了AI初创公司Periodic Labs，目标是打造「AI科学家」。

从OpenAI离职的人前赴后继，令人深思。

OpenAI的人才流失：不只是走了几个人

Schwarzer是近两年OpenAI人才出走潮中的最新一个，但绝对不是最后一个。

2025年以来，离开OpenAI的研究员和高管名单越来越长：前CTO Mira Murati、首席研究官Bob McGrew、研究副总裁Barret Zoph，在2024年集中离职。

2025年夏天，Jason Wei、Zhiqing Sun、Hyung Won Chung等多位研究科学家相继跳槽Meta。

后者在LinkedIn上公开表示，很高兴能「从一张白纸开始，与真正有才华密度的团队共事」，言下之意耐人寻味。

到现在，Altman是OpenAI原始11人创始团队中仅剩的两位成员之一。

两周前，CNN报道称，一批AI研究员正在「边走边拉警报」。

OpenAI的一位研究员在离职时表示，这项技术「有以我们无法理解、更无法阻止的方式操纵用户的潜力」。

OpenAI还在同一周因为反对推出成人模式而解雇了一名安全主管，并被曝解散了专注于确保AI对全人类有益的使命对齐团队。

Schwarzer的离职声明里没有任何批评，反而充满了对OpenAI的善意。

这种体面的分手，反而格外少见。

此时此刻的Anthropic

他选了Anthropic，岗位是RL研究，这个他最擅长的领域，不做管理，就做研究。

Anthropic近两年持续吸引了来自OpenAI的顶尖人才。

2024年，对齐研究负责人Jan Leike、OpenAI联合创始人John Schulman先后加入，前者明确表示是因为对OpenAI「没有认真对待安全」的不满。

2026年初，OpenAI的高级安全研究员Andrea Vallone也跳槽到Anthropic，在Jan Leike手下工作。

而Schwarzer加入的时间节点，格外微妙。

就在前几天，Anthropic正经历它五年历史中最大的一场风波：与五角大楼的正面交锋。

Anthropic拒绝向国防部开放Claude用于大规模监控或全自主武器的权限，特朗普随即在Truth Social上命令所有联邦机构立即停用Anthropic的技术。

而与此同时，OpenAI迅速填补了这一真空，达成向五角大楼开放其模型的协议。

讽刺的是，在Anthropic最艰难的时刻，Claude在苹果App Store的下载量反而超过了ChatGPT，Anthropic的估值目前高达3800亿美元。

Schwarzer在声明结尾写道：「我期待支持在这个重要时刻的朋友们。」

他说的重要时刻，大概不只是指Anthropic自身的研究进展。

Schwarzer选择在这个节点加入，某种程度上是一次站队。

正面临最大危机的Anthropic，正在用一件事证明自己的吸引力：在商业压力和安全底线之间，它选择了后者，哪怕代价是失去整个联邦政府的合同。

对于那些不缺钱、只缺使命感的顶级研究员而言，这种姿态，比任何offer都有说服力。

参考资料：

https://x.com/max_a_schwarzer/status/2028939154944585989?s=20

上一篇：Claude惨遭停用，GPT-4.1接任，绝密备忘录爆出，怒撕「硅谷甄嬛」奥特曼

下一篇：阿里CEO吴泳铭回应林俊旸离职：已决定批准，将继续坚持开源模型策略

返回列表

他亲历了o1的诞生

顶级VP：我只想回去做研究

OpenAI的人才流失：不只是走了几个人

此时此刻的Anthropic

相关新闻