基于多AI智能体打造AI科学家(AI co-scientist)

科学发现依赖于科学家提出新颖的研究假设,并对其进行严格的实验验证。为了增强这一过程,论文Towards an AI co-scientist引入了“AI co-scientist”,这是一个基于 Gemini 2.0 构建的多智能体系统。AI co-scientist的目标是帮助发现全新的原创性知识,并在既有证据基础上、遵循科学家提供的研究目标与指导,生成可被验证的新颖研究假设与提案。该系统的设计采用了“生成—辩论—演化”的假设生成方法,灵感源自科学方法,并通过扩展推理时计算能力来加速这一过程。

本论文研究的关键贡献包括:(1)一个具有异步任务执行框架的多智能体架构,以实现灵活的计算资源扩展;(2)通过锦标赛式演化流程,自我改进地生成研究假设。自动化评估显示,推理时计算资源的持续扩展可持续提升假设质量。尽管该系统具有通用性,本研究聚焦于三个生物医学领域的开发与验证:药物再定位、新靶点发现,以及解释细菌进化与抗菌素抗性机制。

在药物再定位任务中,系统提出了多种候选药物并获得了有前景的验证结果,其中包括用于急性髓性白血病的候选药物,在体外实验中能在临床适用浓度下抑制肿瘤生长;在新靶点发现方面,AI co-scientist提出了针对肝纤维化的全新表观遗传靶点,并通过在人体肝类器官中表现出的抗纤维化活性与肝细胞再生能力得到了验证;最后,AI co-scientist还通过并行的计算发现过程,复现了尚未公开的实验结果,揭示了细菌进化中一种新的基因转移机制。

这些研究成果已在同步发表的独立报告中详细呈现,展示了AI在增强生物医学与科学发现中的巨大潜力,并预示着一个由AI赋能科学家的新时代的到来。

论文作者为Juraj Gottweis, Wei-Hung Weng, Alexander Daryin, Tao Tu, Anil Palepu, Petar Sirkovic, Artiom Myaskovsky, Felix Weissenberger, Keran Rong, Ryutaro Tanno, Khaled Saab, Dan Popovici, Jacob Blum, Fan Zhang, Katherine Chou, Avinatan Hassidim, Burak Gokturk, Amin Vahdat, Pushmeet Kohli, Yossi Matias, Andrew Carroll, Kavita Kulkarni, Nenad Tomasev, Vikram Dhillon, Eeshit Dhaval Vaishnav, Byron Lee, Tiago R D Costa, José R Penadés, Gary Peltz, Yunhan Xu, Annalisa Pawlosky, Alan Karthikesalingam 和 Vivek Natarajan,来自Google, Houston Methodist, Sequome, Fleming Initiative and Imperial College London, Stanford University。

Towards an AI co-scientist
一、AI co-scientist系统总体设计与组成

AI co-scientist是一个基于Gemini 2.0模型的多智能体系统,通过异步任务执行框架构建,具备强大的可扩展性和推理能力。系统接受自然语言形式的研究目标作为输入,随后调用多个具备特定角色的智能体模块,如生成、反思、排名、演化、元评审等,通过“生成—辩论—演化”的流程,模拟科学方法不断迭代生成高质量研究假设。

系统设计的关键特点包括:

  • 使用Elo评分系统进行自动评价与排序,支持自我改进;
  • 具备持续记忆机制,可长期追踪推理状态;
  • 支持专家“人类在环”的反馈,科学家可通过聊天界面参与引导与评审;
  • 支持多种工具与数据库,包括文献检索与结构预测工具AlphaFold等;
  • 可用于探索高度复杂的科学问题,例如抗生素抗性进化机制。
二、智能体模块详解
  1. 生成智能体(Generation Agent):通过网络搜索、科学辩论、自我反思、假设组合等方式生成初步假设,强调创新性、实验可验证性与文献支撑。
  2. 反思智能体(Reflection Agent):对生成假设进行多层次评估,包括初评、深入文献核查、机制模拟、错误分解、现象解释等。模拟人类评审者的思维方式,检测逻辑漏洞与实验可行性。
  3. 排名智能体(Ranking Agent):通过类似象棋排名系统的Elo机制,基于辩论与比较,为每个假设打分并排序,形成“假设锦标赛”。
  4. 演化智能体(Evolution Agent):对高分假设进行组合、重构、简化、类比与“跳跃式创新”,以生成更优质的新假设。
  5. 相似度智能体(Proximity Agent):分析假设间的相似性与距离,支持多样性探索与去重。
  6. 元评审智能体(Meta-review Agent):总结辩论与评审中的共性问题,为下一轮迭代提供改进方向。还能合成最终研究总览并建议潜在合作专家。
三、系统评估与验证结果

论文研究在三个复杂生物医学任务上进行了端到端验证,均取得令人瞩目的成果,相关假设已由体外实验验证,展现出强大的科研辅助能力:

  1. 急性髓性白血病(AML)药物再定位:系统提出若干已上市药物用于AML治疗的新用途,其中包括KIRA6、Leflunomide等此前未被考虑的候选药物,并在体外实验中验证其抑癌效果。
  2. 肝纤维化治疗靶点发现:系统提出3个新的表观遗传靶点,用于抑制成纤维细胞的形成,实验验证表明可促进人类肝类器官的再生。
  3. 细菌抗性机制推理:在未公开数据前提下,系统提出的cf-PICI与噬菌体尾部相互作用机制,与研究人员历时近10年得出的实验结果完全一致,实现了并行的“推理性重发现”。

此外,系统还在GPQA等高难度科学基准集上展示出优异推理能力,Elo评分与专家评估高度一致。并且,在与Gemini、GPT系列、DeepSeek-R1等前沿模型的对比中,AI co-scientist的表现持续提升,并最终超越人类专家的“最佳猜测”。

四、安全性与系统边界

论文特别强调,AI co-scientist系统并非要替代科学家,而是强调“协同式科学”,即AI协助人类科学家激发灵感、拓展方向。论文也设置了明确的安全防线,通过对1200个对抗性问题进行鲁棒性测试,系统均成功拒绝潜在危险性目标,确保其在医学伦理、安全性方面可控。

六、结论与展望

本研究通过提出AI co-scientist系统,首次将大规模推理模型与科学方法深度融合,实现从自然语言研究目标到创新假设再到实验设计的闭环探索。在实验层面已展示其对药物再定位、靶点发现与抗性机制研究的巨大潜力,未来可扩展至更多领域如基础物理材料科学等。

论文作者认为,AI co-scientist不只是一个工具,更是一位能够反思、自我进化并与人类专家协同工作的“虚拟科研伙伴”。随着前沿模型能力提升和人机协同方式不断完善,AI在科研中的角色将从信息辅助者,走向知识共创者。


相关阅读:
Google Deepmind报告:把控赋予科学发现全新机遇的人工智能,迎接科学发现黄金时代
—SciAgents:通过多代理系统(Multi-Agent System)和知识图谱(Knowledge Graphs),实现科学发现的自动化

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注