EmbodiedBench:专门用于评估视觉驱动具身智能体(Vision-Driven Embodied Agents)的基准测试框架
近年来,具身智能体(Embodied Agents)在人工智能研究中受到了越来越多的关注。这些智能体需要具备理 […]
EmbodiedBench:专门用于评估视觉驱动具身智能体(Vision-Driven Embodied Agents)的基准测试框架 Read More »
近年来,具身智能体(Embodied Agents)在人工智能研究中受到了越来越多的关注。这些智能体需要具备理 […]
EmbodiedBench:专门用于评估视觉驱动具身智能体(Vision-Driven Embodied Agents)的基准测试框架 Read More »
据悉,美国国家航空航天局(NASA)与通用原子公司(General Atomics)正在合作测试用于航天的核热
核热推进器(nuclear thermal propulsion , NTP)测试 Read More »
OpenAI o3-mini是 OpenAI 研发的一款增强推理能力的语言模型,其核心训练方法采用大规模强化学
OpenAI o3-mini 系统说明(OpenAI o3-mini System Card) Read More »
物理信息神经网络(Physics-Informed Neural Networks,PINNs)是一种新兴的深
利用混合整数线性优化(Mixed-Integer Linear Programming, MILP)改进 PINNs初始权重,提高训练收敛速度和精度 Read More »
论文Improving LLM Leaderboards with Psychometrical Method
心理测量学(Psychometrical Methodology)技术可用于优化大语言模型LLM的基准测试 Read More »