Agent0:不依赖外部标注数据,基于双智能体 + 工具 + 强化学习,让基础模型在推理能力上持续“自我升级”
论文Agent0: Unleashing Self-Evolving Agents from Zero Dat […]
Agent0:不依赖外部标注数据,基于双智能体 + 工具 + 强化学习,让基础模型在推理能力上持续“自我升级” Read More »
论文Agent0: Unleashing Self-Evolving Agents from Zero Dat […]
Agent0:不依赖外部标注数据,基于双智能体 + 工具 + 强化学习,让基础模型在推理能力上持续“自我升级” Read More »
一、模型定位与总体能力 二、模型架构与训练实现 三、训练数据与数据处理 四、分发与使用渠道 Gemini 3
Gemini 3 Pro 模型说明(Gemini 3 Pro Model Card) Read More »
SIMA 2 本质上是一个「Gemini 驱动的 3D 游戏通用智能体」:它不再只是听话执行指令,而是能在虚拟
SIMA 2:跑在 3D 游戏里的 Gemini 智能体 Read More »
论文BitNet Distillation提出 BitNet Distillation(BitDistill)
BitDistill:LLM权重从FP16量化到1.58-bit,精度基本无损,内存消耗下降显著,推理速度提升 Read More »
论文LLMs Can Get “Brain Rot”!提出并实证验证“LLM 脑腐化(
LLM 脑腐化(Brain Rot):碎片化、吸睛但低信息的内容会在持续预训练中“腐蚀”模型的思考链条与长程记忆,且很难被事后微调完全补救 Read More »