【中国科学报】“机器化学家”是怎样炼成的_行业新闻

【中国科学报】“机器化学家”是怎样炼成的

时间: 2024-08-11 01:03:02 | 作者: 行业新闻

自主阅读海量文献汲取前人智慧，制定实验方案，在无人干预的情况下完成实验全流程，思考出最优解，创造新的化学品和材料。

这正是中国科学技术大学（以下简称中国科大）化学与材料科学学院教授罗毅、江俊团队的作品。8年攻关，他们开发和集成移动机器人、智能化学工作站、智能操作系统、科学数据与模型库，研制出全球首个“数据智能驱动的全流程机器化学家平台”（以下简称机器化学家）。

研究论文发表于《国家科学评论》。审稿人评价，该成果的“机器人系统、工作站和智能化学大脑都是最先进的”，“将对化学科学产生巨大影响”。

“这主要得益于中国科大多学科交叉的背景，促使不同学科的科研人员会集在一起做一件事。我们的目标是建成机器化学家大科学装置，解放化学家双手，加快新化学品和新材料的研发创制。”江俊向《中国科学报》介绍。

提及为何会研发机器化学家，江俊自嘲是因为手笨。早在2003年，还在中国科学院上海技术物理研究所攻读硕博连读学位的江俊经常要做实验。“但是我的手特别笨，所以做实验失败是常有的事。”江俊说，后来他师从罗毅教授，专攻理论化学研究。

在做理论研究中，江俊发现中国人在学术上非常“被动”。“我们做了大量研究工作，最终成果发表在外文期刊上。但引用这些论文数据时还得花钱买，并且只有访问权，不允许大量下载。”江俊认为，“我们该做中国人自己的材料数据库。”

物理学家狄拉克说“公式都是优美的”，底层规则是非常清晰和简单的。但是一旦将理论应用到实践中，解答其方程的复杂度往往高到没办法想象，人类无法计算求解。因此，由于算力和人类思考能力的局限，理论和实践常处于“脱节”状态。这种长期“脱节”，带来了传统化学研究的最大“痛点”——科研人员主要依赖于“穷举”“试错”的手段创制新物质，导致实验成本高、周期跨度长；随着化学研究对象日益复杂化、高维化，面对庞大的化学空间，配方和工艺的搜索常常止步于局部最优，没有办法进行全局探索。

逐渐兴起并快速迭代进化的大数据与人工智能技术为解决这一些难题提供了新的机遇。罗毅、江俊及其团队提出了“机器化学家”的概念，并开展相关科研工作。从2014年到2022年，他们攻坚克难，成功研制出机器化学家。

机器化学家由“化学大脑”、机器人实验员和智能化学工作站三部分所组成。其中最核心的“化学大脑”通过一系列分析大量化学实验和理论数据建立知识图谱，实现了阅读理解文献、设计化学实验、自主优化方案，并配备了人机交互的操作系统，便于“无编程基础”的科研用户使用。机器人实验员和16个智能化学工作站之间能进行数据交换和互动，精准配合执行化学实验。

以研制潜力巨大的高熵化合物催化剂为例，江俊展示了机器化学家的“绝技”：阅读1.6万篇论文，自主遴选出5种非贵金属元素，融合2万组理论计算数据和200组全流程机器实验数据，建立了理实交融的智能模型，从55万种可能的金属配比中找出最优的高熵催化剂。将传统需要消耗大量人力、物力、时间等的“炒菜式”遍历搜索所需的1400年，缩短为5周。

业内专家觉得，机器化学家的研究工作脱离了传统试错研究范式的限制，展现出“最强化学大脑”指导的智能新范式的巨大优势，引领化学研究朝着知识理解数字化、实验操作指令化、材料创制模板化的未来趋势前进，确立了我国在智能化学创新领域的全球领跑地位。

如此“聪慧”的机器化学家，其研发小组成员近30人，多数是“90后”“95后”。他们分工明确，配合默契。

化学实验经验比较丰富的朱青等人负责实验方案设计，并对机器人实验员的操作质量做评估；黄炎等人负责理论模型的计算；张百成编写程序，让机器人读论文、提出科学假设、形成实验报告和方案；肖恒宇和赵路远等主攻系统整体软件架构以及各个化学工作站的软硬件开发；自动化系的尚伟伟、张飞团队负责研制机器人。

“研发中的一个难点在于实现机器人对化学实验操作的精准模仿。”江俊说，人可以自然而然或是通过训练做出很多动作，但是机器人做不到。为解决该难题，尚伟伟与张飞把科研人员做实验的各种动作拍成视频，然后一点点分解，最终实现精准模仿。

另一个难点在于改造智能化学工作站。很多传统的化学工作站与机器人之间并不具备远程通信互动的功能，这就要求团队自主开发。

赵路远和师弟曹嘉祺在编写固体进样仪器的驱动程序时，由于信息掌握不充分，无法准确理解并调用仪器接口。他们多次联系国外仪器厂商和代理商，但得到的回应都是“无可奉告”“商业机密”。于是，他们决定自力更生。

“当时，我们用3个星期，重复做了3000次发送信号、等待反馈、记录响应的实验，逐步逆向试出底层控制逻辑，成功实现了对机器人的远程控制。”赵路远说，令她自豪的是，后来国外仪器厂商主动联系，想购买他们研发的驱动程序。

2021年12月2日，机器化学家迎来第一次“大考”——系统整体试运行。小组成员信心满满，结果不尽如人意。“化学设备单独运行时是正常的，但参与到系统联调时却没办法使用。”肖恒宇说，小组成员通宵达旦排查原因，仍无头绪。

肖恒宇想到化学设备和机械臂均使用了红外探测设备，可能会互相干扰。于是，他将机械臂换一个朝向，解决了问题。

在之后的开发调试中，不相同的领域的仪器设施、不同系统的程序通信间，都出现了类似的磨合难题，团队运用交叉学科思维，将它们逐一解决。

面对的问题越复杂，就越考验跨学科的思考能力。令江俊欣慰的是，小组成员在面临技术难题时，从不“摆烂”，从不应付交差。一个方案受挫，他们集智攻关，敢于突破，大胆创新，反复测试，在挫折和失败中汲取经验。

人们一般是通过“望闻问切”就能了解实验进展情况，比如奇怪的味道、不同的颜色，但机器人不能实时判断出这些变化。这也是江俊团队正在攻克的难题——用现代化手段赋予机器人物质级别的感知能力。

何谓物质级别感知能力？“简单来说，就是增强机器人摄像头‘本领’——既有红外视觉又有可见光视觉，使机器人能识别出颜色变化。此外，还能加上光谱。科研人员根据光谱变化，进而了解实验中微观物质演化情况。”江俊解释。

未来，江俊希望能建成一个机器化学家大科学装置，在一整栋大楼里，布置上百个机器人、上千个智能化学工作站。一边，全国的化学家、材料学家只需在网上提交自己的任务；另一边，小组成员通过智能操作系统分时安排机器人达成目标，最后将方案反馈给科学家们。

基于这样一个大平台，不但可以让各个课题组的实验数据交汇、共享，产生海量数据，自动提炼出数字化的知识图谱和人工智能的模型，进而指导机器人自动优化产生更好、更高效率的化学品或新材料，而且在完成各个实验的过程中，机器人通过与科研人员互动，默默学习人类的操作逻辑、思维模式，在若干年之后，有望变成一个真正智能、创造力比肩大学教授的机器化学家。

“我们希望争取到国家的支持，在2至3年内建成拥有几十个机器人的小型装置，3至5年后建成一个大科学装置。在这期间，我们还需要不断训练机器人和智能化学通用模型。”江俊规划着未来的研究蓝图。他们的最终目标是改变传统化学研究范式，解放化学家双手。

近年来，各种交叉学科、各种新技术层出不穷，似乎各种知识都要抓紧学习。对此，结合自己的研究经历和体会，江俊建议青年学者首先保证“基础宽而厚实”，其次要“涉猎广泛”。

“从研发机器化学家这套系统来看，我发现底层的物理化学规则最重要。所以刚开始不要着急，先把本专业知识点学扎实、逻辑理清楚，然后适时地把其他专业内容嫁接过来。”因此，江俊认为青年学者既要用开放式思维做交叉科学，又要保证精通自己的专业。此外，他建议，一定要相信年轻人，让他们尝试富有挑战性的大课题。