OpenAI o3-mini是 OpenAI 研发的一款增强推理能力的语言模型,其核心训练方法采用大规模强化学习,并能够运用“思维链”(Chain of Thought,CoT)进行推理。这一方法允许模型在生成最终回答之前先进行逻辑推理,并得出合理的结论,从而提高答案的准确性,同 Read more
物理信息神经网络(Physics-Informed Neural Networks,PINNs)是一种新兴的深度学习方法,它结合了前馈神经网络(Feedforward Neural Network,FNN)与用常微分方程(ODE)或偏微分方程(PDE)表示的系统先验知识。这种方法 Read more
论文Improving LLM Leaderboards with Psychometrical Methodology通过心理测量学方法(Psychometrical Methodology)分析 LLM 排行榜(Leaderboards)的测量质量,发现其存在测量效度不足、排 Read more
近年来,大规模语言模型(LLMs)的快速发展使其在推理、代码生成、科学计算等任务上展现出越来越强的能力,逐步缩小了与人工通用智能(AGI)之间的差距。然而,即使是最先进的 LLM,如 OpenAI 的 GPT-4o 和 Claude-3.5-Sonnet,仍然在一些高阶推理任务上 Read more
论文ASAP: Aligning Simulation and Real-World Physics for Learning Agile Humanoid Whole-Body Skills提出ASAP框架,该架构通过两阶段训练和delta动作模型的结合,有效解决了仿真与现实世 Read more
PhysicsX是一家专注于将人工智能应用于工程领域的公司,其推出的Airplane技术演示器基于最新的“大型几何模型LGM-Aero”,旨在通过生成式设计和深度学习加速航空航天工程中的设计流程。该工具面向无人机爱好者、科技爱好者及专业航空航天工程师,提供从概念生成到性能预测的全 Read more
论文A decoder-only foundation model for time-series forecasting提出了一种解码器专用的时间序列基础模型 TimesFM,通过大规模时间序列数据的预训练,使其具备强大的零样本预测能力,能够高效适应不同任务,减少计算成本,并在 Read more
论文Evolving Deeper LLM Thinking提出了一种创新的进化搜索策略——Mind Evolution,旨在通过更加高效地利用推理时间计算资源,提升大型语言模型(LLM)在解决复杂问题时的推理能力。传统的LLM解决问题方法往往依赖于单一的推理步骤或固定的推理路径 Read more
论文Gated Delta Networks: Improving Mamba2 with Delta Rule提出了Gated DeltaNet架构,通过结合门控机制和Delta更新规则,提升线性Transformer在长序列建模和信息检索任务中的表现。 论文作者为Songli Read more
诺贝尔奖得主、Google DeepMind首席执行官Demis Hassabis于1月21日(周二)表示,他预计由人工智能(AI)设计的药物将在今年年底前进入临床试验。 在瑞士达沃斯举行的世界经济论坛炉边对话中,Hassabis提到,这些药物正在Isomorphic Labs开 Read more
论文A survey on FPGA-based accelerator for ML models对基于现场可编程门阵列(FPGA)机器学习(ML)加速器的研究现状及发展趋势进行了全面综述。论文作者为Feng Yan, Andreas Koch, Oliver Sinnen,来 Read more
论文Do generative video models learn physical principles from watching videos?开发了Physics-IQ这一基准数据集,专门用来测试生成性视频模型在理解物理原则方面的能力。研究的目标是检验当前模型是否能够从 Read more