Ilya Sutskever 在 2024 年的 NeurIPS 大会上发表演讲。演讲以数据枯竭的现状为切入点,深入探讨了 AI 未来发展的技术方向、哲学反思与社会影响。他提出,未来的 AI 系统将通过代理性和推理能力实现根本性飞跃,摆脱对传统预训练方法的依赖;同时,AI 的扩展 Read more
Nature刊文The AI revolution is running out of data. What can researchers do?(《人工智能革命正在耗尽数据资源——研究人员该怎么办?》),探讨了人工智能(AI)领域面临的数据瓶颈问题,并提出了潜在的解决方案。文 Read more
Agentic AI(代理型人工智能)是人工智能发展的一个重要阶段,代表了一种能够自主行动、决策和执行复杂任务的智能系统。这种技术超越了传统的生成式AI(Generative AI),不仅仅用于生成内容或提供静态建议,而是能够像人类一样,拥有一定程度的自主性和智能性,完成任务并适 Read more
论文B'MOJO: Hybrid State Space Realizations of Foundation Models with Eidetic and Fading Memory提出了新架构B'MOJO,该架构通过动态整合形象记忆与渐变记忆,克服了现有模型在记忆管理和长序 Read more
论文ChatQA: Surpassing GPT-4 on Conversational QA and RAG提出了名为ChatQA的模型,其在检索增强生成(RAG)和对话式问答(Conversational QA)任务中表现超越了GPT-4。 论文作者为Zihan Liu, W Read more
Google Deepmind近日发布报告A new golden age of discovery---Seizing the AI for Science opportunity(《把控赋予科学发现全新机遇的人工智能,迎接科学发现黄金时代》)。该报告以极其详尽的方式探讨了AI Read more
论文Understanding Transformer Reasoning Capabilities via Graph Algorithms《通过图算法理解 Transformer 的推理能力》主要探索了Transformer 在解决图推理任务时的理论与实践表现。Transfo Read more
论文NaVILA: LEGGED ROBOT VISION-LANGUAGE-ACTION MODEL FOR NAVIGATION提出了一个用于腿式机器人导航的新型视觉语言行动模型框架NaVILA。NaVILA框架通过创新性的分层设计,成功实现了腿式机器人在复杂场景中的视觉-语 Read more
论文Pretraining Codomain Attention Neural Operators for Solving Multiphysics PDEs提出新型架构Codomain Attention Neural Operator (CoDA-NO)。CoDA-NO通过引 Read more
论文Learning the rules of peptide self-assembly through data mining with large language models(《通过大型语言模型的数据挖掘学习肽自组装的规则》)系统性研究了肽的自组装行为,重点在于结合实验 Read more
论文LLM-based agentic systems in medicine and healthcare探讨了基于大语言模型(LLM)的代理系统在医学和医疗保健中的应用。文章的核心目标是展示如何将LLM扩展为具备感知、思考和行动能力的“智能代理系统”(agentic syst Read more
论文PaliGemma 2: A Family of Versatile VLMs for Transfer(《PaliGemma 2: 用于迁移学习的多功能视觉-语言模型家族》)详细介绍了PaliGemma模型的升级过程。PaliGemma 2基于Gemma 2系列语言模型,是 Read more