论文Image segmentation with traveling waves in an exactly solvablerecurrent neural network介绍了一种新型数学技术,旨在打开人工智能系统中的“黑箱”,从数学层面理解神经网络的决策过程。 在当今技术 Read more
微软AI部门CEO Mustafa Suleyman近期在Time撰文AI Companions Will Change Our Lives,阐述AI伴侣即将改变大众的生活。 当今社会中人们普遍面临的压力和困惑。随着全球化和数字化的发展,无论是在工作还是家庭中,人们的生活都显得异 Read more
幻觉(Hallucinations,即事实性不准确的回答)依然困扰着大型语言模型(LLMs)。尤其是在面对更复杂的任务以及用户寻求具体且高度详细的回答时,这些模型往往表现不佳。论文FACTS Grounding Leaderboard: Benchmarking LLMs’ Ab Read more
论文Physics-constrained coupled neural differential equations for one dimensional blood flow modeling提出了PCNDE框架(Physics-constrained coupled ne Read more
论文Accurate predictions on small data with a tabular foundation model提出了TabPFN(Tabular Prior-data Fitted Network)这一基于生成式Transformer模型的表格数据基础模 Read more
In-Context Learning (ICL) 可翻译为 “上下文学习” 、 “情境学习”或者“内在学习”。(ICL) 是近年来在自然语言处理(NLP)领域中取得显著进展的一种技术。它指的是通过将训练数据、任务说明或示例直接嵌入到输入中,来进行学习和推理的过程,而不需要显式的 Read more
论文Let Your Graph Do the Talking: Encoding Structured Data for LLMs提出的GraphToken方法通过参数高效的图数据编码方式,在LLMs中实现了显著的图推理(graph reasoning)能力提升。GraphTo Read more
NVIDIA 宣布推出 NVIDIA Cosmos™,一个包含最先进的生成性世界基础模型、先进的标记器、保护机制以及加速视频处理管道的平台,旨在推动物理 AI 系统的发展,如自动驾驶车辆(AVs)和机器人。 物理 AI 模型的开发成本高昂,并且需要大量的现实世界数据和测试。Cos Read more
论文Agentic Systems: A Guide to Transforming Industries with Vertical AI Agents探讨了代理系统(Agentic Systems)的快速发展及其在行业中的转型作用。随着传统软件即服务(SaaS)平台的局限性逐 Read more
OpenAI首席执行官山姆·奥特曼(Sam Altman)刚发了篇博文,标题为Reflections(思考/反思)。 ChatGPT的第二个生日刚过去一个多月,现在我们已经进入了一个新的模型时代,这些模型能够进行复杂的推理。新的一年总是让人充满反思的情绪,我想分享一些个人的想法, Read more
论文A theory of appropriateness with applications to generative artificial intelligence(《适宜性理论及其在生成式人工智能中的应用》)由来自Google DeepMind等机构的多个领域专家共同撰写 Read more
一、简介 近年来,大型语言模型(LLM)取得了飞速发展,向通用人工智能(AGI)迈进的步伐越来越快。DeepSeek-V3作为一款大规模的混合专家模型(MoE),具有6710亿参数,其中每个令牌激活37亿参数。为了实现高效的推理与经济的训练,DeepSeek-V3采用了多头潜在注 Read more





