
新智元报道

【新智元导读】「最好的模型还没来,Scaling不会停!」字节AI大牛顾全全挥手告别。从打爆AlphaFold 3到投身LLM基建,顶尖学者的下一步引爆全网猜测。
国内大厂突失一员猛将!
就在刚刚,AI4S团队核心成员顾全全官宣离开字节跳动Seed团队。
在职三年,他横跨了两条完全不同的战线,AI制药和LLM预训练。
用他自己的话说,「很少有机会能让人同时做治病和造前沿智能这两件事」。
至于下一步的去向,目前还未透露。

清华出发,一路打到UCLA
这位大佬来头不小。
顾全全本硕毕业于清华大学,之后赴美深造,在UIUC师从数据挖掘领域大牛Jiawei Han,2014年拿到计算机科学博士学位。

博士毕业后,他先在Princeton做博后,2015年去University of Virginia任助理教授,2018年加入UCLA。
2022年,他同时拿下Sloan Research Fellowship和NSF CAREER Award,同年升为副教授,并在UCLA创建了AGI Lab。
研究方向覆盖非凸优化、深度学习理论和强化学习。

他在学术界一个比较有影响力的工作是SPIN(Self-Play Fine-Tuning),核心思路是让LLM跟自己的历史版本对弈,不需要额外的人类标注数据就能把弱模型炼强。目前论文被ICML 2024录用。
某种程度上,这个研究方向也预示了他后来在字节的转向,从纯学术走向大规模模型训练工程。

Google Scholar被引已超过30000次
2023年,他以Research Scientist身份加入字节Seed,开启了三年的工业界生涯。
把AlphaFold 3拉下王座
加入字节后,顾全全的第一个身份是AI制药负责人。
他在这条线上最具标志性的工作,就是主导了SeedFold的研发——
FoldBench综合评测中,在多数蛋白质相关任务上超越了AlphaFold 3的生物分子结构预测模型。

要知道,AlphaFold系列是DeepMind的王牌项目,AlphaFold 2拿过诺贝尔化学奖,AlphaFold 3更是把预测范围从蛋白质扩展到了DNA、RNA、配体等几乎所有生物分子类型。
在这个级别的对手面前,SeedFold直接让蛋白质单体预测lDDT达到了0.8889,抗体-抗原界面DockQ 53.21%,蛋白质-RNA界面DockQ 65.31%,均超过AlphaFold 3。


SeedFold之外,团队在AI制药赛道上还有两张牌。
SeedProteo是一个蛋白质结合物设计模型。和多数方法只设计骨架不同,SeedProteo在全原子级别直接设计蛋白质,使用了一个「Design View」模块来引导生成过程。
在10个benchmark靶标上的测试中,SeedProteo的成功率和多样性都超过了AlphaProteo、RFdiffusion、Chai-2、BinderCraft和BoltzGen这些主流开源方法。


DPLM系列则是团队在蛋白质语言模型上的持续投入,已经迭代了三代。
DPLM是第一个基于离散扩散的蛋白质语言模型,在进化规模的蛋白质序列上做预训练,统一了表征学习和生成两个任务,发表在ICML 2024。
DPLM-2加入了多模态能力,能同时生成氨基酸序列和3D结构,入选ICLR 2025。
最新的DPLM-Evo更进一步,在扩散过程中显式建模蛋白质进化中的替换、插入和删除操作,已被ICML 2026接收。
三代模型,每一代都在往「通用蛋白质基础模型」的方向推进。

从炼药到炼模型
2025年初,Quanquan Gu做了一次大转向。
从AI制药切到LLM预训练,他加入了Seed的预训练团队,并在其中创建了LLM optimization and scaling team,专攻一个问题,怎么在前沿规模上稳定、高效地把模型炼出来。
这个团队搭建的预训练栈,为Seed 2.0的成功训练提供了关键基建支撑。
而这也是他在字节参与的最后一个公开项目。

在告别推文的最后,顾全全写道:「最好的模型还没来,Scaling不会停。」
参考资料:
https://x.com/QuanquanGu/status/2061638562362392788
