论文Automating the Search for Artificial Life with Foundation Models提出了一个新的研究范式,利用基础模型(Foundation Models, FMs)自动搜索人工生命(Artificial Life, ALife)模拟。
论文作者为Akarsh Kumar, Chris Lu, Louis Kirsch, Yujin Tang, Kenneth O. Stanley, Phillip Isola, David Ha,来自MIT, Sakana AI, OpenAI, The Swiss AI Lab IDSIA。其中Kenneth O. Stanley为独立研究者。
一、绪论
人工生命(Artificial Life,简称ALife)是一个跨学科领域,致力于通过计算机模拟研究生命现象。该领域的核心思想不仅仅是研究“已知的生命形式”,而是探索“可能的生命形式”。然而,人工生命的研究面临一个显著挑战:由于大规模的生命现象通常由简单的规则或元素相互作用产生,研究人员在设定模拟时很难通过直觉设计出能够产生复杂行为的规则。因此,历史上ALife领域的进展主要依赖人工设计和试错,这限制了对“未知”生命形式的探索和发现。
随着基础模型(Foundation Models,FMs)的发展,AI领域取得了突破性进展。基础模型通过从海量数据中学习并能够生成与人类认知一致的表征,成为了解决这一挑战的关键工具。FMs的通用性和表达能力使其在各个领域,尤其是人工生命的研究中,拥有巨大的潜力。本文提出了自动化人工生命搜索(Automated Search for Artificial Life, ASAL)框架,该框架通过使用视觉-语言基础模型来自动搜索人工生命模拟,从而加速对ALife现象的发现。
ASAL的核心目标是通过基础模型,自动发现和探索人工生命模拟中的新现象。具体来说,ASAL能够:
- 通过搜索指定目标事件或行为,找到能够实现这些目标的模拟。
- 发现产生时序性开放性新奇现象的模拟。
- 照亮整个模拟空间,揭示多样性的生命形式。
二、相关研究
人工生命动机:
人工生命的主要目标是模拟生命的起源、演化和行为,但与生物学研究不同,ALife追求的是普遍适用的生命原理,而不仅仅是地球上的生命形式。这使得ALife系统涵盖了从细胞自动机(Cellular Automata,CA)到神经网络代理的广泛模型。这些系统研究了自组织、开放式演化、智能行为和集体智慧等现象。
ALife基质:
ALife研究中使用的基质种类繁多,包括经典的生命游戏(Game of Life)和Lenia等连续动态模拟。这些基质通常依赖简单的规则集,通过大量的交互作用形成复杂的行为模式。例如,Lenia对经典生命游戏进行了推广,允许在连续空间和时间中模拟生命现象,而神经细胞自动机(Neural Cellular Automata,NCA)则通过神经网络对更新规则进行参数化。这些基质都在研究复杂性和涌现行为方面发挥着重要作用。
自动化搜索算法:
自动化搜索是ALife领域中常用的工具,尤其当目标事件或行为能够明确界定时。早期,遗传算法被用来进化细胞自动机(CA)以产生特定的计算结果。近年来,基于新奇性搜索和质量多样性优化算法的研究,已经显著扩展了这一领域。尽管如此,大多数现有的搜索方法还是受到数据表达不完备的限制,无法完全捕捉到人类对复杂性的理解。
基础模型的应用:
基础模型(如CLIP)在多个领域取得了显著进展,例如药物发现、物理预测等。在人工生命的应用中,基础模型的引入能够帮助研究人员更好地对模拟行为进行量化,且可以通过与人类认知相似的方式,度量和分析模拟中涌现的现象。本文首次将基础模型引入ALife模拟中,为自动化生命现象搜索提供了新思路。
三、方法:自动化人工生命搜索
ASAL框架的设计:
ASAL方法通过将人工生命模拟转化为三个不同类型的自动化搜索任务,利用基础模型实现对ALife现象的探索。
- 监督目标搜索:
监督目标搜索任务旨在找到那些能够产生特定事件或行为序列的模拟。例如,研究人员可以输入“一个细胞”或“自我复制分子”这样的文本提示,ASAL将根据提示自动优化模拟,使其生成符合预期行为的图像。这种方法能够帮助研究人员发现与我们现实世界相似的生命形式或推测可能的生命进化轨迹。 - 开放性搜索:
开放性指的是模拟能够持续生成新奇的、不可预测的现象。ASAL通过优化历史新奇性度量,寻找那些在每个时间步都有新颖表现的模拟。这种方法的优势在于,它通过度量模型空间中的新颖性来评估“开放性”,从而避免了人工设置目标的局限。 - 照亮搜索空间:
照亮搜索空间的目标是系统地探索模拟空间中的多样性,帮助研究人员发现新的、独特的模拟行为。例如,ASAL能够搜索出具有丰富群体行为的模拟,或者发现比传统模拟更加复杂的生命形式。
基础模型的作用:
在ASAL中,使用了视觉-语言基础模型(Vision-Language Models, VLMs),例如CLIP,将模拟产生的图像与自然语言文本进行对齐。这使得ASAL能够根据人类对生命的直观理解进行搜索,从而自动发现符合我们设定的目标或新奇现象的模拟。
四、实验
1. 目标模拟搜索:
在Lenia、Boids和粒子生命基质上,ASAL成功地通过监督目标搜索发现了与指定提示匹配的模拟。在Lenia中,ASAL发现了符合“一个细胞”或“自我复制分子”等提示的模拟,并生成了与这些目标一致的图像。
2. 开放性模拟搜索:
通过在生命游戏的变体中执行开放性搜索,ASAL成功地识别出了具有开放性特征的模拟。这些模拟能够生成持续的新颖性,表现出类似自然界中生命不断进化的特点。例如,ASAL发现了一些模拟,它们不仅不会停止变化,还会在模拟过程中不断生成新的结构。
3. 照亮整个搜索空间:
ASAL还利用照亮搜索空间的方法,在Lenia和Boids基质中探索了丰富的多样性。例如,在Lenia中,ASAL发现了之前未见过的生命形式,模拟中的细胞和细菌形态呈现出不同的颜色和形状。对于Boids,ASAL重新发现了群体行为,探索出了如蛇形、环形、聚集等不同的集群行为。
4. 定量分析:
ASAL不仅可以发现新现象,还能够定量分析这些现象。例如,通过测量CLIP相似度,ASAL能够判断粒子生命模拟中“毛虫”形态的形成与粒子数量之间的关系,证明了“更多就是不同”的规律。此外,ASAL还通过测量模拟过程中的CLIP向量变化,提供了关于Lenia模拟是否已经进入静止状态的定量指标。
五、结论
本文提出的ASAL方法通过基础模型的引入,成功地实现了人工生命模拟的自动化搜索。实验结果表明,ASAL不仅能够有效地发现符合目标的模拟,还能够识别出开放性和多样性的模拟行为,推动了人工生命研究的进展。
未来方向:
未来,ASAL可以进一步结合视频-语言基础模型,以更好地处理动态模拟,或者采用三维基础模型来应对三维空间中的模拟。此外,结合大规模的计算能力和更强大的基础模型,ASAL可能帮助科学家自动搜索出更加复杂的生命形式,甚至揭示外星生命的可能性。