Nature发表文章AI protein-prediction tool AlphaFold3 is now open source,深入报道了AlphaFold3的开源历程以及其在科学界的反响。这一决定不仅有助于推动蛋白质结构预测的学术研究,也为药物发现和生物技术创新提供了新的可能性。
AlphaFold3是由谷歌旗下的DeepMind公司开发的人工智能(AI)模型,用于预测蛋白质的结构及其与DNA、药物等其他分子的相互作用。AlphaFold系列工具一直致力于攻克生物学中“蛋白质折叠问题”这一重大挑战,特别是AlphaFold2因其卓越的结构预测能力受到科学界广泛赞誉,并因此获得了2024年化学诺贝尔奖的一部分。
AlphaFold3的一个重要特点是,它可以在与其他生物分子共同作用的情况下,预测蛋白质的三维结构。与之前的AlphaFold2不同,最初DeepMind选择通过一个受限的网络服务器(web server)来提供对AlphaFold3的访问。这意味着科学家只能通过该服务器进行特定数量和类型的预测,并且无法在服务器上预测药物存在情况下的蛋白质行为。DeepMind最初为AlphaFold3提供的访问权限受到了学术界的广泛批评。许多科学家表示,不提供模型代码和权重会影响模型的重现性和研究的透明性。DeepMind认为,通过服务器限制访问可以在确保研究人员获得工具的同时,保护其商业利益。特别是,DeepMind的子公司Isomorphic Labs致力于将AlphaFold3应用于药物发现,因而保持代码和权重的封闭性,以便获得商业竞争优势。
但是,在科学界对这种封闭做法表示不满之后,DeepMind迅速改变了态度,决定在六个月内将AlphaFold3的代码开源。2024年11月11日,DeepMind正式宣布学术界的科学家可以下载AlphaFold3代码并进行非商业用途的使用,但训练权重仍然需要通过申请获取,仅对有学术背景的研究人员开放。
开源的决定一方面是回应科学界对研究透明性的要求,另一方面也是为了推动科学研究的进一步发展。DeepMind团队对开源的潜力充满期待,团队负责人John Jumper提到:“我们非常期待看到人们会如何使用这个工具。” 他还提到,AlphaFold3的开源可能会带来一些意想不到的创新应用,即使有些尝试可能会失败,但也有可能带来巨大的突破。
DeepMind并不是唯一一个开发蛋白质结构预测工具的公司。自AlphaFold3发布以来,已有多个公司宣布推出了基于AlphaFold3的类似工具。例如,中国的百度和字节跳动推出了各自版本的蛋白质结构预测模型;旧金山的初创公司Chai Discovery也推出了一个名为Chai-1的模型。虽然这些工具在某种程度上借鉴了AlphaFold3的思路,但它们同样受到商业许可的限制,即这些模型不能用于商业应用,尤其是在药物发现方面。然而,Chai Discovery的模型Chai-1通过网络服务器为药物发现提供服务,这为科学家提供了一定的便利,但其仍然受到访问方式的限制。另一家旧金山公司Ligo Biosciences则发布了没有使用限制的AlphaFold3版本,但其功能尚不完整,尤其是无法对药物和其他非蛋白质的分子进行建模。这些不同公司和研究团队的竞争,展现了蛋白质结构预测这一领域的开放性和快速发展。随着时间的推移,更多公司加入到这一领域,并推出各自的改进版本,推动整个学科的进步。
AlphaFold3的开源受到了科学界的欢迎,尤其是那些致力于理解蛋白质与药物相互作用的研究人员。哥伦比亚大学的计算生物学家Mohammed AlQuraishi指出,虽然现在存在多个基于AlphaFold3的模型,但它们仍然不允许商业用途,限制了药物开发等领域的应用潜力。
AlQuraishi正在带领团队开发完全开源的模型,名为OpenFold3,并计划在年内推出。这一模型的目标是消除对商业用途的限制,使得制药公司可以基于专有数据(如蛋白质与特定药物结合的结构)来重新训练和优化模型,以提高其性能。这样的开放性意味着,制药公司可以根据自己的需求对模型进行优化,从而在新药研发中获得更好的预测结果,增强自身的竞争优势。
此外,DeepMind的Pushmeet Kohli也提到,尽管最初AlphaFold3没有提供开源代码,但科学界已经有多个团队成功地基于伪代码复现了AlphaFold3的模型。这表明,尽管缺少开源代码,AlphaFold3的设计具有较高的可重现性。
开放源码的重要性不仅在于技术的传播,更在于激发科学创新。AlphaFold2的开源曾带来了许多科学上的创新。例如,科学家们曾利用AlphaFold2设计出能够结合癌症靶标的新型蛋白质,甚至帮助识别出一种关键的蛋白质,该蛋白质在精子与卵子结合中起到重要作用。
Jumper提到,AlphaFold3的开源将带来更多类似的惊喜,尽管有些应用可能不会成功,但这些尝试本身也代表着科学探索的重要价值。他认为,科学家们会用各种“奇怪”的方式来使用这一工具,而这些尝试可能会带来意想不到的科学突破。
AlphaFold3 on GitHub: https://github.com/google-deepmind/alphafold3