又走一个,OpenAI研究VP离职,转投Anthropic做RL研究员
8 小时前 / 阅读约7分钟
来源:36kr
OpenAI前研究副总裁Max Schwarzer宣布离职,转投Anthropic,理由是渴望回归一线IC研究工作。他在OpenAI主导post-training团队,参与训练多个重要模型。他的离职反映了AI行业内部因价值观而产生的深刻分裂。

心态崩了!OpenAI又走了一个重量级人物。

刚刚,前研究副总裁Max Schwarzer在X上发文,宣布正式离开OpenAI,转投Anthropic。

他在OpenAI主导整个post-training团队,亲手参与训练了o1、o3,以及GPT-5、5.1、5.2、5.3-Codex全系列模型。

但他不是被挖走的,是自己主动选择走的,理由是「渴望回归一线IC研究工作」。

这个选择,比离职本身更耐人寻味。

他亲历了o1的诞生

在AI圈,Max Schwarzer算不上家喻户晓,但他的履历相当拿得出手。

2024年3月,他在蒙特利尔人工智能研究院Mila完成博士答辩,导师是强化学习领域的两位重量级人物:Aaron Courville和Marc Bellemare。

博士期间,他的研究聚焦在「规模化与样本高效强化学习」的交叉地带。

通俗来说,就是怎么让RL训练既强又省。

他在2023年ICML发表的论文拿下了当年的顶会奖项,证明了不依赖LLM或世界模型,纯靠扩展无模型RL就能达到人类水平的样本效率。

论文传送门:https://arxiv.org/abs/2305.19452

但真正让他进入OpenAI核心圈的,是他对推理的判断。

2024年9月12日,o1-preview发布当天,他发帖说这是「推理时代的开端」。

他是OpenAI o1的核心贡献者之一,参与了「草莓团队」(Strawberry team)的RL算法开发,o1-preview的早期去风险化实验更是出自他手。

之后,他主导了o1和o3的post-training,2025年3月晋升为研究副总裁,领导整个post-training团队,负责打磨GPT-5系列。

从应届博士生入职,他用不到两年半时间就坐上了研究VP的位置。

顶级VP:我只想回去做研究

离职声明里都是对OpenAI的称赞:「OpenAI有我见过的最有才华的一批研究员」「我学到的东西超出了我作为应届毕业生时的想象」。

关于离职的真正的理由,他说:

领导了一年的post-training工作之后,我渴望重新出发,回到IC研究岗位。我一直在认真考虑回归技术研究这件事,而且我真心相信,我的同事和团队在没有我的情况下完全能够继续成功。

这句话值得细品。

IC研究,相对于管理角色来说,就是亲手写代码、跑实验;管理层负责管人、协调资源、做路线规划。

对研究员来说,升得越高,离真正的研究越远。

Schwarzer显然不适应这种状态。

他在OpenAI的最后一年,更多时间花在带团队、做决策上。

站在研究VP的位置上,他可以影响几十人的研究方向,但自己动手的空间少了很多。

这种选择在AI行业并不罕见,但肯做出这个选择的人需要勇气。

毕竟,「研究VP」的头衔在任何简历上都足够好看,放弃它回去当普通研究员,不是每个人都愿意的。

事实上,Schwarzer不是第一个从post-training主管位置出走的人。

他的前任Liam Fedus,同样担任过OpenAI研究副总裁兼post-training负责人,于2025年3月离职,随后联合创办了AI初创公司Periodic Labs,目标是打造「AI科学家」。

从OpenAI离职的人前赴后继,令人深思。

OpenAI的人才流失:不只是走了几个人

Schwarzer是近两年OpenAI人才出走潮中的最新一个,但绝对不是最后一个。

2025年以来,离开OpenAI的研究员和高管名单越来越长:前CTO Mira Murati、首席研究官Bob McGrew、研究副总裁Barret Zoph,在2024年集中离职。

2025年夏天,Jason Wei、Zhiqing Sun、Hyung Won Chung等多位研究科学家相继跳槽Meta。

后者在LinkedIn上公开表示,很高兴能「从一张白纸开始,与真正有才华密度的团队共事」,言下之意耐人寻味。

到现在,Altman是OpenAI原始11人创始团队中仅剩的两位成员之一。

两周前,CNN报道称,一批AI研究员正在「边走边拉警报」。

OpenAI的一位研究员在离职时表示,这项技术「有以我们无法理解、更无法阻止的方式操纵用户的潜力」。

OpenAI还在同一周因为反对推出成人模式而解雇了一名安全主管,并被曝解散了专注于确保AI对全人类有益的使命对齐团队。

Schwarzer的离职声明里没有任何批评,反而充满了对OpenAI的善意。

这种体面的分手,反而格外少见。

此时此刻的Anthropic

他选了Anthropic,岗位是RL研究,这个他最擅长的领域,不做管理,就做研究。

Anthropic近两年持续吸引了来自OpenAI的顶尖人才。

2024年,对齐研究负责人Jan Leike、OpenAI联合创始人John Schulman先后加入,前者明确表示是因为对OpenAI「没有认真对待安全」的不满。

2026年初,OpenAI的高级安全研究员Andrea Vallone也跳槽到Anthropic,在Jan Leike手下工作。

而Schwarzer加入的时间节点,格外微妙。

就在前几天,Anthropic正经历它五年历史中最大的一场风波:与五角大楼的正面交锋。

Anthropic拒绝向国防部开放Claude用于大规模监控或全自主武器的权限,特朗普随即在Truth Social上命令所有联邦机构立即停用Anthropic的技术。

而与此同时,OpenAI迅速填补了这一真空,达成向五角大楼开放其模型的协议。

讽刺的是,在Anthropic最艰难的时刻,Claude在苹果App Store的下载量反而超过了ChatGPT,Anthropic的估值目前高达3800亿美元

Schwarzer在声明结尾写道:「我期待支持在这个重要时刻的朋友们。」

他说的重要时刻,大概不只是指Anthropic自身的研究进展。

Schwarzer选择在这个节点加入,某种程度上是一次站队。

正面临最大危机的Anthropic,正在用一件事证明自己的吸引力:在商业压力和安全底线之间,它选择了后者,哪怕代价是失去整个联邦政府的合同。

对于那些不缺钱、只缺使命感的顶级研究员而言,这种姿态,比任何offer都有说服力。

参考资料:

https://x.com/max_a_schwarzer/status/2028939154944585989?s=20