Agent0:不依赖外部标注数据,基于双智能体 + 工具 + 强化学习,让基础模型在推理能力上持续“自我升级”
论文Agent0: Unleashing Self-Evolving Agents from Zero Dat […]
Agent0:不依赖外部标注数据,基于双智能体 + 工具 + 强化学习,让基础模型在推理能力上持续“自我升级” Read More »
论文Agent0: Unleashing Self-Evolving Agents from Zero Dat […]
Agent0:不依赖外部标注数据,基于双智能体 + 工具 + 强化学习,让基础模型在推理能力上持续“自我升级” Read More »
凸优化用在火箭助推器回收降落上,本质上是:把一个本来非常复杂、非线性的“怎么安全、节省燃料地降落”问题,改写成
凸优化(Convex Optimization):用于火箭助推器的回收降落控制 Read More »
对于“深度学习”,很多“深度”其实是一种错觉:表面上是网络多了很多层、参数和算力,但真正决定模型能力的,经常是
新型模型架构HOPE:基于嵌套学习(Nested Learning),在推理和使用过程中也会更新记忆 Read More »
论文Forecasting the eddying ocean with a deep neural netw
WenHai(问海):全球海洋预报AI模型 Read More »
一、模型定位与总体能力 二、模型架构与训练实现 三、训练数据与数据处理 四、分发与使用渠道 Gemini 3
Gemini 3 Pro 模型说明(Gemini 3 Pro Model Card) Read More »