Demis Hassabis谈DeepMind和AI的发展

2024年10月1日,Demis Hassabis在《泰晤士报》2024技术峰会上与主持人进行了深入交流。Demis Hassabis在此次访谈中系统地阐述了DeepMind的历史、目标以及在迈向通用人工智能的过程中所面临的挑战。从逻辑系统到深度学习和强化学习的结合,从专用AI模型的突破到通用智能系统的追求,他的分享为我们描绘了一幅AI发展的宏伟蓝图。他对AI的未来持谨慎乐观的态度,坚信AI将为人类带来巨大的福祉,但同时也呼吁国际社会合作,共同应对其中的潜在风险。

一、DeepMind的创立动机与AI的发展背景

Demis Hassabis提到,创立DeepMind的动机来源于对传统AI方法的深刻思考。早期的AI技术依赖逻辑系统和专家系统,例如上世纪90年代的深蓝(Deep Blue),其本质上是由程序员编写具体规则来实现特定任务。这些系统是“脆弱的”,因为它们无法超越编程者的知识,也无法自行学习和适应新的任务。

Hassabis认为,AI领域长期处于“AI冬天”的原因是这些逻辑系统的固有局限性。这些系统不能创新,只能机械地执行编程者制定的规则。他在剑桥和MIT时观察到,这些基于逻辑系统的方法在当时仍被广泛接受,但他意识到必须转向能够自主学习的新方法。因此,DeepMind的理念是构建一种可以通过数据和经验进行自我学习的AI系统,而不是依赖人为编程的特定规则。

二、深度学习与强化学习的结合

DeepMind在2010年成立时,正值深度学习(Deep Learning)在学术界开始崭露头角。Hassabis提到,强化学习(Reinforcement Learning)同样被他们认为是未来AI发展的关键,特别是因为这种方法与人类和动物的神经系统中的多巴胺机制相似。通过强化学习,AI系统可以像人类一样通过反馈信号不断优化自身行为,逐步接近最佳策略。

他们还看到了硬件方面的进步,尤其是GPU(图形处理单元)的应用。Hassabis指出,GPU原本是为了计算机图形学而设计,但它的矩阵计算能力使其非常适合深度学习模型的训练。将深度学习、强化学习与GPU技术结合,成为DeepMind最初的技术策略。他将这项工作比作“阿波罗计划”,因为他们需要将这些新兴的理论和硬件整合在一起,才能真正实现AI的快速发展。

三、AlphaGo与深度强化学习的突破

在谈及AlphaGo时,Hassabis解释了他们为何选择从游戏入手。他的个人背景与游戏紧密相关,且他认为游戏长期以来一直是AI发展的试验场。从图灵(Alan Turing)和香农(Claude Shannon)时代开始,许多AI的早期尝试都是基于棋类游戏,如国际象棋。这些游戏为AI研究者提供了一个清晰的评估平台,通过与人类或其他AI进行对战,可以直接衡量AI系统的性能。

AlphaGo的设计目标不仅仅是打败围棋世界冠军,而是开发出一种通用的强化学习方法,可以在多个领域进行迁移。因此,他们使用AlphaGo证明了一种通用的学习系统的可行性,并将这些技术应用到科学领域,例如蛋白质折叠问题,这成为了AlphaFold项目的基础。

四、AlphaFold与科学探索

Hassabis特别提到,蛋白质折叠问题一直是他个人非常感兴趣的科学问题之一。通过AlphaFold,DeepMind成功地解决了这一长期以来困扰科学界的问题,这展示了AI在科学研究中巨大的应用潜力。与游戏不同,蛋白质折叠问题的目标是找到一个实际的科学解决方案,这意味着DeepMind必须在基础算法之上添加专门的改进,以便适应蛋白质折叠的特定需求。

AlphaFold展示了AI在复杂科学问题上的潜力,而DeepMind未来的发展目标则是继续推动AI在其他科学和工业应用中的突破。Hassabis指出,AI可以在解决癌症、加速药物发现等方面发挥重要作用,其终极目标是开发出能够适应各种任务的通用人工智能(AGI)。

五、从专用模型到通用人工智能

Hassabis强调,DeepMind的终极目标是开发AGI,即一种能够独立执行任何人类认知任务的系统。当前的AI系统,如AlphaFold、AlphaGo,都是专用模型,即使它们的技术具有一定的通用性,但应用范围仍然有限。而AGI的目标是创建一种通用系统,能够在无需预先编写规则的情况下解决广泛的任务。

为了实现这一目标,Hassabis提出了多模态(Multimodality)技术的重要性。他们的新模型“Gemini”是一种多模态模型,能够处理视觉、听觉、文本、视频、代码等多种输入形式。他认为,多模态模型将成为实现AGI的重要组件,因为它们更接近人类处理信息的方式。然而,他也坦言,这还不足以完全实现AGI,还需要一些尚未实现的关键技术突破。

六、研究与商业化的平衡

在演讲中,Hassabis也谈到了研究与商业应用之间的关系。他表示,DeepMind最初是按照贝尔实验室(Bell Labs)的模式构建的,目的是成为世界上最优秀的工业研究实验室之一,能够发明未来的技术。随着时间推移,DeepMind的许多研究成果被应用于谷歌的产品中,例如聊天机器人、生产力工具、医学应用等。这种研究与应用的结合,使得他们的技术可以迅速从实验室走向市场。

他指出,如今的AI技术在很多方面已经成熟,可以广泛应用于科学、数学、医学等领域,而不再局限于实验室研究。特别是在科学探索、数学推理以及医学诊断等领域,DeepMind已经展示了AI在解决实际问题方面的巨大潜力。

七、多模态助手Astra与下一代AI助手

Hassabis介绍了DeepMind正在开发的多模态助手“Astra”,这是他们实现AGI的路径之一。Astra能够帮助用户处理日常生活中的各类任务,如识别周围环境、找回遗失物品、解答问题等。Hassabis称之为“通用助手”,因为它能够在不同设备之间无缝协作,成为用户生活中的常伴工具。

Astra的开发旨在推动AGI的研究,因为它的多模态能力和对上下文的理解,使得它在交互体验上更接近人类智能。然而,他也指出,当前的聊天机器人和数字助手在某些方面仍然“被动”,无法主动规划和执行复杂任务,因此,未来需要在记忆、推理、规划等方面取得进一步的进展,才能实现更高级的通用智能系统。

八、实现AGI的技术挑战

在迈向AGI的道路上,Hassabis提到了一些尚未解决的技术挑战。他认为当前的AI系统缺乏规划和行动的能力,现有的聊天机器人更多是被动的问答系统,而AGI需要能够主动制定计划、执行任务,并在现实世界中采取行动。此外,个性化和记忆也是未来AGI需要具备的重要能力,使其能够了解用户的偏好,记住用户的习惯。

他还谈到了一些内部的研究辩论,例如AGI是否需要通过“工具使用”来增强其能力。一个可能的思路是,AGI可以调用专用的AI模型来完成特定任务,比如调用AlphaFold进行蛋白质折叠计算,或者调用AlphaGo进行围棋对弈。另一个思路是将这些专用模型的功能“集成”到AGI系统中,以形成更加统一的智能体系。这些研究问题目前尚无定论,但它们代表了实现AGI的不同路径。

九、AI的社会影响与风险

Hassabis对AI的未来持乐观态度,但也强调了其中的风险。他提到,AI的影响将远超互联网和移动技术,有可能彻底改变社会运作的方式。他认为AGI将带来“激进的富足”,即不再有资源短缺的问题,从而使经济模式发生深远变化。因此,他呼吁现在就开始考虑如何分配这种富足带来的利益,例如考虑普遍基本收入等形式。

此外,他也承认存在AI带来的“末日”风险,因此,他签署了一些公开信,呼吁对AGI的发展保持谨慎。他认为,我们有足够的时间来解决这些问题,但必须从现在开始投入更多的研究,尤其是在可控性、系统目标和价值观的定义等方面。他特别提到,AI安全研究所的建立(如英国和美国的AI安全研究所)是一个积极的信号,但还需要投入更多的努力,以确保这些技术能够被安全地应用。

十、英国在AI领域的发展

在谈及英国在AI领域的地位时,Hassabis认为英国在AI研究方面拥有巨大潜力,特别是在学术和技术生态系统方面。他提到,DeepMind在英国的存在有助于建立一个以AI为基础的生态系统,吸引了大量的AI创业公司。他建议政府应该鼓励本地投资,并简化规划许可程序,尤其是在靠近可再生能源的地区建设数据中心等设施,以保持英国在AI研究和应用中的竞争力。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注