如何朝着物理世界的“奇点”迈进？MIT团队为实验科学家打造科研AI助理

麻省理工科技评论-如何朝着物理世界的“奇点”迈进？MIT团队为实验科学家打造科研AI助理

CRESt 系统的操作非常简单，实验科研人员只需要用自然语言，就能够掌控一整套自动化实验平台，而不用学习任何编程语言。

为实现自动化实验真正落地和普及，麻省理工学院（MIT）李巨教授团队为实验科研人员打造了一款类似电影《钢铁侠》中的贾维斯系统 CRESt（Copilot for Real-world Experimental Scientist），为加速人类在自然科学的探索提供了新希望。

CRESt 系统的操作非常简单，实验科研人员只需要用自然语言，就能够掌控一整套自动化实验平台，而不用学习任何编程语言。

该论文第一作者、MIT 博士研究生任之初表示，在不远的未来，每一位实验科研人员都应该配有一位科研 AI 助理，他/她能够帮助我们设计并开展自动化实验、分析实验数据、提出机理猜想，甚至是排忧解惑。科研 AI 助理能够大幅减少实验工作者重复性的体力劳动，让科研工作者能够把主要精力放在批判性思考上。

0467cabb237a4c6381ae5f92553b741c~tplv-obj.image?traceid=20230901153250C4D9121E708018E4A0A7&x-expires=2147483647&x-signature=4gkrMNxSKCy9T7U0CZUvBiyPWaQ%3D

01e99e911a2041eb80d6df1ac4414819~tplv-obj.image?traceid=20230901153250C4D9121E708018E4A0A7&x-expires=2147483647&x-signature=puZc48Ye60CTCvf8auM3rjrD41Q%3D

图丨相关论文（来源：ChemRxiv、Nature Reviews Materials）

日前，相关论文以《CRESt – 现实世界实验科学家的 AI 助理》（CRESt – Copilot for Real-world Experimental Scientist），《由主动学习和AI驱动的智能自主实验》（Autonomous experiments using active learning and AI）为题分别发表于 ChemRxiv[2]和 Nature Reviews Materials[3]。两篇论文第一作者均为 MIT 材料系博士研究生任之初，李巨教授为论文通讯作者。

8620c3caa930405bb657b1554f3115f3~tplv-obj.image?traceid=20230901153250C4D9121E708018E4A0A7&x-expires=2147483647&x-signature=12O%2BFe4DweEAnrf%2FM1r6q2eVduE%3D

图 | 任之初（来源：任之初）

谈及研究的背景和意义时，任之初表示，他和身边 MIT 的同学时常会讨论一个问题：在过去的几十年间，为什么比特世界比原子世界的发展快这么多？

和不同专业的同学聊这个话题往往会得到不一样的答案，但大多都会提到以下两点：

比特世界的迭代速度显著快于原子世界。得益于计算机芯片的迅速发展，一个脚本的迭代速度可能在几分钟内完成，而一个机器学习模型的周期也大多数在几小时或者几天。相较而言，真实的自然科学实验，从样品制备到测试表征，一轮迭代的时间则通常是以周乃至月来计算的。

雪上加霜的是，真实世界的实验可重复性远低于代码执行。后者虽然也存在一定的随机性，但通过固定随机种子等方法，可以大幅提升可重复性。

然而，Nature 在 2016 的一项覆盖了 1500 位科学家的调查表明，有超过 70% 的人表示无法重现他人的工作，并且有超过 50% 的人表示他们甚至无法重现自己的实验结果[4]。

最糟糕的是，不像代码报错那样有清晰明确的错误回溯，真实世界的实验工作者往往要花费大量的时间，去确认究竟是哪个细节出了问题，导致实验重复不出来（例如近期超导材料的故事）。

在迭代速度慢、可重复性低的双重劣势下，自然科学以远低于计算机科学的速度发展不足为奇。虽然近些年一些自然科学仿真实验的进步，使得该问题有所缓解，但在许多领域，仿真实验结果和真实实验之间仍存在着较为显著的差距。

在以器件级性能为最终优化目标的项目中，这种差距尤为严重。例如锂电池的器件级性能，可以说一半取决于化学，另一半取决于工艺。而目前的仿真工作大多聚焦于化学分子层面，要想预测这些分子在特定的工艺下会发生怎样的变化，在模拟领域还是一个巨大的挑战。

因此，仿真实验或许可以帮助研究人员筛掉许多不那么“有前途”的化学配方，但要真正地确定一个最佳的“配方 + 处理”工艺，仍旧需要大量的真实实验去验证。

在这样的情况下，以主动学习为代表的，以真实世界测得的性能驱动的模型显得至关重要。在高维输入（配方/工艺）输出（各项指标）空间的参数优化问题上，通过直觉去迭代实验参数会变得十分困难，但主动学习算法不会迷失——它能够在每一轮实验都给予我们一定的引导，给出下一轮实验参数的建议。

841ba92acc6d4425a4f728d16aabe5e2~tplv-obj.image?traceid=20230901153250C4D9121E708018E4A0A7&x-expires=2147483647&x-signature=dpPm8mq7Cs5i%2FzvO7vnWyqz9HnI%3D

图 | CRESt 内嵌了主动学习推荐算法（来源：MIT）

在大语言模型面世之后，我们经常会听到一些讨论：人类的奇点是否即将到来？从 ChatGPT 最近的代码解释器自身快速迭代 debug 的表现来看，比特世界确实很可能即将迎来一场巨变。

但也许只是比特世界的巨变还不足以称之为“人类的奇点时刻”，毕竟比特世界经常“巨变”。或许只有当自然科学也迎来同等级别的变革时，人类的奇点时刻才是真正的到来了。那么，大语言模型是否有能力引发一波自然科学领域颠覆性的浪潮呢？

除了依赖仿真实验的进步之外，他们还预计高通量自动化实验平台将会扮演一个非常重要的角色。机械臂不仅能够夜以继日地开展大量的并行实验（提升迭代速度），其可靠性相比于手动实验而言也可以说有着天壤之别（提升可重复性）。

近年来，自动化实验在自然科学领域受到了越来越多的关注，许多实验室都有在购置一些自动化程度更高的模块，但将不同的模块串联成一整套系统的案例仍旧不多。究其原因，除了需要一笔不小启动经费之外，根据课题组的工作流定制一套自动化系统往往需要许多工程经验，尤其是需要写大量的代码。

此外，即便平台已经开发完成，做实验出身的科研人员有编程基础的毕竟还是少数，大多数人则仍旧需要一个偏商业化的用户图形界面，而这个开发成本就更加高了。因此，“会 Python” 几乎就成了操作自动化系统的必要条件之一，而这极大地限制了自动化实验平台在传统实验室中普及的速度。

7b17944312d74c33a8358e812b603ef1~tplv-obj.image?traceid=20230901153250C4D9121E708018E4A0A7&x-expires=2147483647&x-signature=dpiUiUPjo0gN6x724goScmRV2Fs%3D

图 | CRESt 通过模拟人类操作鼠标、键盘输入，可以控制实验室内许多自动化的模块（来源：任之初）

所以，解决这个困境的方法是让大量实验科研人员都去学 Python 等编程语言吗？显然不是。MIT 团队 CRESt 项目的目标，是推动自动化实验能够真正落地并普及，实验科研人员只需要用自然语言就能够掌控一整套自动化实验平台，并能够清晰地表达自己的需求，而不用学习任何编程语言就可以实现自动化实验。

在 ChatGPT 诞生前，这件事几乎是无法想象的。“但是如今，为实验科研人员打造一个类似电影《钢铁侠》中的贾维斯系统已经完全成为了可能。我们十分期待这一助力能够大幅加速人类在自然科学道路上探索的速度，迎来真正的‘奇点’时刻。”任之初表示。

c6ba9be9f56c4ace91d18c6e7319c70a~tplv-obj.image?traceid=20230901153250C4D9121E708018E4A0A7&x-expires=2147483647&x-signature=5mcUENOIcqTvJV1AiqtBreAPfyA%3D

图 | 即使科研人员离开实验室之后也能够通过手机和 AI 助理对话并开展实验（来源：MIT）

据了解，CRESt 系统大概经历了三年的研发时间，主要是搭建并调试自动化实验平台和创造 CRESt 智能助手。“由于是全新的研究方向，我们并没有足够的经费，因此我们从头开始走的是 DIY 路线。如果经费充足的话可能能省两年的时间，只需要向做自动化实验平台客制化的公司说明需求就可以，但那往往要上百万美元。”任之初表示。

该团队多花了两年的时间，换来的是用大约 5% 的成本实现了差不多的自动化效果，以及极大的开发自由度。这为第二阶段的工作奠定了重要的基础——在 ChatGPT API 进行 0613 这一重大更新之后，他们只用了一个星期就完成了 CRESt 的雏形。

387aeca13331495f8999bd7b2f7acaaa~tplv-obj.image?traceid=20230901153250C4D9121E708018E4A0A7&x-expires=2147483647&x-signature=QYiRbuqhsqpEfDMA%2BFCbuNL%2BoP0%3D

图 | 分工明确——科研人员负责精细操作，机械臂则负责重复性的任务（来源：MIT）

据了解，该团队利用这套自动化平台目前已经找到了一些远胜于传统材料的高熵合金配方，接下来的计划是进一步提升实验通量，寻找能源领域中突破性的新材料。

参考资料：

1.https://youtu.be/POPPVtGueb0

2.Ren, Z. C., Zhang, Z., Tian Y. S. & Li, J. CRESt – Copilot for Real-world Experimental Scientist. ChemRxiv(2023). https://doi.org/10.26434/chemrxiv-2023-tnz1x

3.Ren, Z., Ren, Z., Zhang, Z. et al. Autonomous experiments using active learning and AI. Nature Reviews Materials 8, 563–564 (2023). https://doi.org/10.1038/s41578-023-00588-4

4.Baker, M. 1,500 scientists lift the lid on reproducibility.Nature 533, 452–454 (2016). https://doi.org/10.1038/533452a

Recommend

腾讯李强：近期将对外发布混元大模型

Slint 1.2 Released with Enhanced Platform Abstraction

深圳龙华区20万征集的LOGO有结果了！

Teachersgram up to 35% off teacher shirts for autumn

这家钢铁公司获收购邀约：当前市值166亿元

iPhone 15系列最新机模曝光新增深蓝色和泰坦灰两款新配色

Step-by-Step Guide: Setting Up a Git Repository Hosting Server

Discover the benefits of consent-based marketing: Privacy and personalization

The definitive guide to object-oriented programming in PHP

UserTesting expands platform with generative AI to scale human insights

About Joyk