顶刊生物实验难复现?统一操作话术来了,编译通过率98.6%
11 小时前 / 阅读约13分钟
来源:36kr
AI在生物制造领域应用受限,因缺乏统一实验语言。恩和科技开发BPL语言及BPL-COGEN工具,实现实验标准化。发布SAION AI平台,实现科研闭环,提升实验效率。

现在的AI,确实越来越像一个「全能研究员」。

写代码、画图、生成视频只是基础操作。

它甚至开始参与科学研究:阅读论文、提出假设、分析实验数据,甚至帮科学家设计下一步实验方案。

但问题是,如果把AI真正放进一间生物实验室,情况可能完全不一样。

毕竟,在生物实验室里,操作移液器、记录温度、转移培养皿……这些看似简单的动作,背后都有极高的精度要求。

一个单位写错,一个参数偏差,一个步骤顺序颠倒,实验结果可能直接失效。

AI能帮科学家设计实验,却很难真正执行实验。问题出在哪?

你说它太傻?不。

前段时间,被称为Anthropic“史上最强”模型Claude Fable 5,上线后因风险问题被紧急叫停。

强推理能力兼具科研价值与安全隐患,这是AI进入科研领域最大的尴尬。

有时,它确实能告诉你「应该怎么做」,但大多时候它却未必真的知道「实验到底发生了什么」。

看来大脑再强,没有一套能让AI理解的、统一的生物实验语言也不行。

这两年,虽然AI4Science很火,但真正进入产业核心链路的案例不多。

生物学科想要为产业贡献更多价值,实验室的工作必须可以被工程化、被重复执行

最近,一篇发表在全球生物论文库bioRxiv上的研究,让行业看到了新的可能。

论文主要介绍两件事:

AI看不懂生物实验?好,那就开发一套统一、好理解的生物学协议语言——Biology Protocol Language (BPL)

传统生物实验编程语言门槛高,科研人员很难独立编写、操作相关代码?别急,一切交给代码自动生成工具BPL-COGEN就行了。

我看了下作者单位,均来自Bota Biosciences(恩和科技),一家中国生物制造公司

诶~专业的事还是得交给专业人来做啊。(doge)

为什么AI迟迟进不了生物制造?

说出来你可能不信。

都已经全民AI时代了,很多顶尖生物科学家依然被困在实验台前

在移液枪和培养皿之间,他们每天都要消耗大量时间,手工作业。

这些设备构成了现代生物制造最核心的生产力,但同时也构成了最大的效率瓶颈。

原因很简单,生物实验天然很难标准化。

同一个实验,不同实验员操作习惯不同;同一种设备,不同厂家接口格式不同;同一份实验记录,不同团队的数据结构也完全不同。

结果就是,实验室里最宝贵的经验,大量沉淀在人脑中。

一个实验在A实验室成功了,换个地方可能就复现不出来

数据难积累,流程难复制,自动化难闭环。

整个行业长期依赖DBTL(设计-构建-测试-学习)循环。

但这条链路也高度依赖人工经验。

现阶段生物学领域仍依赖自然语言文本撰写实验方案。

比如:加入5毫升试剂,在37度环境培养一段时间,轻轻混匀。

对于人类来说,这种描述没有问题。但对于机器来说,这几乎等于没说

5毫升加到哪里?培养多久?“轻轻”到底有多轻?

每个模糊表达都会带来执行上的歧义。

而在软件工程、芯片设计等行业,这类问题几十年前就被解决了。

程序员不会写一句“差不多运行一下”,芯片工程师也不会写一句“大概这样连接” 。

他们使用的是标准化、可编译、可验证的描述语言。只有这样,系统才能稳定运行。

生物制造长期缺少的,正是这样一种语言。

过去二十年,学界并非没有尝试改变过。

BioCoder、Autoprotocol、Antha、LabOP等标准化方案格式相继出现。

但要么表达能力有限,要么须绑定特定设备,要么使用门槛过高。

最关键的是,两大难题始终没解决:

一是自动生成能力不足,方案泛化性差,相关脚本、配置需科研人员手动编写,开发周期冗长;

二是无法保证足够高的执行精度。

这些年,生物制造想拥抱AI,又困于AI,AI4Science总卡在最后一公里。

BPL来了!

恩和科技AI与Computation总监Alex Song说了一个非常现实的问题。

很多顶刊论文,即使发表在Nature、Science上,别人想复现实验,依然困难

不是科学原理不公开,而是实验过程缺少统一表达方式。

对于恩和来说,这个问题更加迫切。因为他们本身就在做AI驱动的生物制造

恩和过去造AI,大模型生成的也是自然语言。那么如何与实验室里的自动化设备进行交互?中间就必须有「翻译」的过程。

你总不想机器人做一个实验,今天可以做得出来,明天做不出来了吧?

在这样的背景下,恩和开发了BPL语言。

如果一定要找一个类比,BPL之于生物实验,有点像Python之于编程

大家看到的是应用,终端看到的是代码。

同样的道理,科研人员看到的是实验方案,实验室设备看到的是标准化协议代码。

只有完成这层转换,实验才能被工程化,才能被重复。

更重要的是,BPL不仅是一种描述语言,还是一种可编译语言

写过程序的人都知道,代码正式运行前要先编译。编译器会检查语法错误、逻辑错误和运行风险。

BPL也是一样。

在实验开始之前,它会先完成一轮软件层面的实验「仿真」:检查单位是否正确、试剂是否存在、容器容量是否超限、步骤之间是否存在逻辑冲突。

一旦发现问题,系统直接报错。而不是等整个实验失败了再返工。

这意味着,过去实验室里加高的试错成本,现在提前在数字世界里解决了

但光有语言还不够,写代码的问题咋办嘛。你总不能要求每个生物学家都变成程序员吧?

基于BPL,恩和进一步开发了BPL-COGEN

比如你告诉它:完成PCR(临床基因扩增)实验。

系统会自动把自然语言翻译成标准化BPL代码,随后进入编译器检查环节:

发现错误-自动修复-继续检查-继续修复,直至代码通过编译与仿真校验,系统才会将合规指令同步至实验室,启动实体实验。

整个逻辑很像Claude Code、Cursor。只是写的不是软件代码,而是实验代码。

话又说回来,BPL-COGEN靠谱吗?

论文里写道,为了量化生成防范的精准度,团队从《Nature Protocols》中选取了30篇经典实验方案,覆盖分子生物学、细胞培养、生化分析等多个领域。

注意,关键一步来了。恩和构建了Benchmark基准测试集

这是之前没有过的创新点。

该Benchmark采用大模型评审+编译器客观校验结合的模式,从内容匹配度、方案有效性、实验完整性三个维度给实验打分。

结果相当亮眼:同一实验重复生成10次代码98.3%的结果完全一致。

综合得分达到95.1分,其中方案有效性得分高达98.7分。

恩和团队并没有止步于「干实验」,还同步做了两个「湿实验」验证。

1、同一份BPL代码,一边转成人工操作说明书,一边转成自动化移液机执行脚本。

两套体系测序、荧光检测结果无显著差异。

2、液相色谱实验,将原本32分钟的分析流程被自动转换成2.1分钟的超高效方案。

5种脂溶性物质全部实现基线分离,分离顺序与原方法完全一致。

值得一提的是,Benchmark基准测试中,编译器累计检出343项问题,包括单位不匹配、容器过载、试剂未定义等。

模型首轮生成代码编译通过率82.3%,最多三轮自动修复后整体通过率98.6%,仅1.4%的问题无法修复。

「AI科学家」上线

科研驱动产业、产业反哺科研。

有了全套的底层技术,接下来就要考虑如何高效完成产业化落地

基于BPL语言,恩和科技发布了全球首个面向生物制造领域的Physical AI平台:SAION AI。

它的定位很明确,AI科学家

很多人理解中的AI科学家,往往停留在文献搜索或者实验建议阶段,但SAION AI的能力更全面,覆盖整个科研闭环。

比如,现有科研人员想研发一款高效产酶的菌株。

只需在SAION AI中输入:开发可用于食品发酵的高活性蛋白酶菌株,降低发酵成本30%。

系统就会自动检索文献,分析技术路线,筛选出关键技术要点,生成详细到每一步操作的实验方案。

随后,这份方案会通过恩和自研的BPL语言,直接传输到恩和的「生物铸造厂」,由自动化设备标准化完成质粒设计、菌株构建、培养检测等所有湿实验环节,全程无需人工干预

实验完成后,所有数据会自动回流至SAION AI。模型再通过分析数据,继续优化下一轮实验设计,形成完整闭环。

当实验可以被标准化描述,AI才第一次真正理解生物制造。

从架构来看,SAION AI由三层组成:

认知层:负责理解科学问题和生成实验方案。

控制层:负责BPL编译、校验和任务编排。

执行层:负责驱动真实实验设备完成操作。

整个过程像一个不断进化的科学大脑。这恰恰是Physical AI最核心的特征。

为什么我们要用菌株工程场景举例呢?在生物制造里,这是最核心、最基础的内容之一。

它与生物元件共同组成了生物制造的核心资产,几乎是所有工业化生产绕不开的起点。

传统模式下,在单个研发项目里,一年大约完成500个菌株实验。

但在SAION AI加持下,效率直接开挂。

这位全天候的「AI科学家」,单个项目同期可落地30万组实验,单日工作量秒杀过去一整年。

背后团队

2019年,恩和科技成立于杭州。

与很多AI创业公司不同,他们从一开始就没有把全部赌注押在模型上,而是同步建设了一座由Physical AI驱动的「生物铸造厂」Cell2Cloud

这套系统覆盖菌株工程、工艺开发到规模化生产全流程,最初看是在解决实验室自动化问题,如今却更像是一次面向Physical AI时代的提前布局。

因为AI真正稀缺的,从来不是参数,而是数据。尤其是在生物制造这种物理约束极强的行业里,高质量真实实验数据比模型本身更难获得。

Cell2Cloud持续产生千万级真实实验数据,同时连接百万级文献与专利知识,构建起行业少有的数据飞轮。

后来诞生的BPL语言,以及SAION AI背后的认知能力,本质上都建立在这套基础设施之上。

某种程度上说,很多公司在训练AI,恩和则是在建设AI科学家的训练场

这套体系背后的推动者,是恩和科技创始人兼CEO崔好

崔好本科毕业于加拿大多伦多大学,随后获得哈佛医学院与MIT联合培养的医学工程与医学物理博士学位,是2025年世界经济论坛「全球青年领袖」。

博士期间,她曾以第一作者/核心作者身份在《Science》《Nature Nanotechnology》《PNAS》等国际顶刊发表多篇论文,并拥有多项合成生物学与自动化实验相关发明专利。

创业后,她带领团队构建起BPL、Cell2Cloud和SAION AI三大核心能力。

看似是三项技术,本质上却指向同一个目标:把AI从「纸上推理」变成能够7×24小时自主完成湿实验的AI科学家。

这种路线很早就获得产业与资本认可。

2021年,恩和科技完成1亿美元B轮融资,投资方包括红杉中国、五源、源码、百度、美团、巴斯夫、经纬等头部机构与产业资本。

如今,恩和已将技术能力转化为面向食品、营养健康、个人护理等领域的规模化解决方案,并与新和成、SYENSQO、伊利、BASF、珀莱雅、百雀羚等企业建立了合作。

如果说BPL解决的是AI如何理解实验,那么恩和想证明的,则是另一件更大的事:

Physical AI不只是机器人行业的未来,它同样正在重构生物制造的生产方式。

One more thing

任何产业走向规模化,都绕不开一件事:把经验变成标准,把知识变成机器能够理解的规则。

半导体产业就是最典型的例子。

EDA(电子设计自动化)出现之前,芯片设计高度依赖工程师经验,验证成本高、试错周期长。

EDA的价值,不只是提升效率,而是第一次把芯片设计转化为可描述、可验证、可仿真的数字资产。

某种意义上,没有EDA,就不会有今天的半导体产业。

而今天的生物制造,正处在类似阶段。

如果说Cell2Cloud是Physical AI的身体,SAION AI是Physical AI的大脑,那么BPL就是连接两者的神经系统。

从这个角度看,BPL的意义早已不只是提高实验效率。

它更像是生物制造领域的「EDA」,一套面向未来产业的底层基础设施。