人工智能AI

幻觉(Hallucinations,即事实性不准确的回答)依然困扰着大型语言模型(LLMs)。尤其是在面对更复杂的任务以及用户寻求具体且高度详细的回答时,这些模型往往表现不佳。论文FACTS Grounding Leaderboard: Benchmarking LLMs’ Ab Read more
论文Physics-constrained coupled neural differential equations for one dimensional blood flow modeling提出了PCNDE框架(Physics-constrained coupled ne Read more
论文Accurate predictions on small data with a tabular foundation model提出了TabPFN(Tabular Prior-data Fitted Network)这一基于生成式Transformer模型的表格数据基础模 Read more
In-Context Learning (ICL) 可翻译为 “上下文学习” 、 “情境学习”或者“内在学习”。(ICL) 是近年来在自然语言处理(NLP)领域中取得显著进展的一种技术。它指的是通过将训练数据、任务说明或示例直接嵌入到输入中,来进行学习和推理的过程,而不需要显式的 Read more
论文Let Your Graph Do the Talking: Encoding Structured Data for LLMs提出的GraphToken方法通过参数高效的图数据编码方式,在LLMs中实现了显著的图推理(graph reasoning)能力提升。GraphTo Read more
NVIDIA 宣布推出 NVIDIA Cosmos™,一个包含最先进的生成性世界基础模型、先进的标记器、保护机制以及加速视频处理管道的平台,旨在推动物理 AI 系统的发展,如自动驾驶车辆(AVs)和机器人。 物理 AI 模型的开发成本高昂,并且需要大量的现实世界数据和测试。Cos Read more
论文Agentic Systems: A Guide to Transforming Industries with Vertical AI Agents探讨了代理系统(Agentic Systems)的快速发展及其在行业中的转型作用。随着传统软件即服务(SaaS)平台的局限性逐 Read more
OpenAI首席执行官山姆·奥特曼(Sam Altman)刚发了篇博文,标题为Reflections(思考/反思)。 ChatGPT的第二个生日刚过去一个多月,现在我们已经进入了一个新的模型时代,这些模型能够进行复杂的推理。新的一年总是让人充满反思的情绪,我想分享一些个人的想法, Read more
论文A theory of appropriateness with applications to generative artificial intelligence(《适宜性理论及其在生成式人工智能中的应用》)由来自Google DeepMind等机构的多个领域专家共同撰写 Read more
一、简介 近年来,大型语言模型(LLM)取得了飞速发展,向通用人工智能(AGI)迈进的步伐越来越快。DeepSeek-V3作为一款大规模的混合专家模型(MoE),具有6710亿参数,其中每个令牌激活37亿参数。为了实现高效的推理与经济的训练,DeepSeek-V3采用了多头潜在注 Read more
论文Automating the Search for Artificial Life with Foundation Models提出了一个新的研究范式,利用基础模型(Foundation Models, FMs)自动搜索人工生命(Artificial Life, ALife) Read more
论文Generative Agent Simulations of 1,000 People提出了一种基于生成式人工智能的代理架构,用于模拟1,052名真实个体的态度和行为。研究的目标是通过深度访谈和大语言模型(LLMs)的结合,构建能够跨越多种社会场景的通用人类行为模拟系统,从 Read more