EmbodiedBench:专门用于评估视觉驱动具身智能体(Vision-Driven Embodied Agents)的基准测试框架
近年来,具身智能体(Embodied Agents)在人工智能研究中受到了越来越多的关注。这些智能体需要具备理...
Read MoreOpenAI o3-mini 系统说明(OpenAI o3-mini System Card)
OpenAI o3-mini是 OpenAI 研发的一款增强推理能力的语言模型,其核心训练方法采用大规模强化学...
Read More利用混合整数线性优化(Mixed-Integer Linear Programming, MILP)改进 PINNs初始权重,提高训练收敛速度和精度
物理信息神经网络(Physics-Informed Neural Networks,PINNs)是一种新兴的深...
Read More心理测量学(Psychometrical Methodology)技术可用于优化大语言模型LLM的基准测试
论文Improving LLM Leaderboards with Psychometrical Method...
Read MoreASAP框架:有效解决仿真与现实世界之间的动力学不匹配问题,实现人形机器人在现实世界中的高效全身运动控制
论文ASAP: Aligning Simulation and Real-World Physics for...
Read MoreMind Evolution:结合基因搜索算法与LLM的生成能力,利用进化策略在自然语言空间中高效搜索解决方案
论文Evolving Deeper LLM Thinking提出了一种创新的进化搜索策略——Mind Evol...
Read MoreGated DeltaNet架构:结合门控机制和Delta更新规则,提升线性Transformer在长序列建模和信息检索任务中的表现
论文Gated Delta Networks: Improving Mamba2 with Delta Rul...
Read More基于现场可编程门阵列(FPGA)机器学习(ML)加速器的研究现状及发展趋势
论文A survey on FPGA-based accelerator for ML models对基于现场...
Read MorePhysics-IQ(物理智商?)基准数据集:测试生成性视频模型在理解物理原则方面的能力
论文Do generative video models learn physical principles...
Read MorerStar-Math:有效提升小型语言模型(Small Language Models, SLMs)在数学推理任务中的表现
论文rStar-Math: Small LLMs Can Master Math Reasoning with...
Read More智能代理(Agents)+用户偏好模拟(Sims)+助理(Assistants)=新型智能代理生态系统
论文Agents Are Not Enough认为,仅具有代理能力不足以解决问题,构建一个包含智能代理、用户偏...
Read More复值循环神经网络(Complex-Valued Recurrent Neural Network,cv-RNN):从数学层面理解神经网络的决策过程
论文Image segmentation with traveling waves in an exactly...
Read More












