大语言模型LLM

Agent0：不依赖外部标注数据，基于双智能体 + 工具 + 强化学习，让基础模型在推理能力上持续“自我升级”

发表评论 / Tech / NullThought

论文Agent0: Unleashing Self-Evolving Agents from Zero Dat […]

Agent0：不依赖外部标注数据，基于双智能体 + 工具 + 强化学习，让基础模型在推理能力上持续“自我升级” Read More »

Gemini 3 Pro 模型说明（Gemini 3 Pro Model Card）

发表评论 / Tech / NullThought

一、模型定位与总体能力二、模型架构与训练实现三、训练数据与数据处理四、分发与使用渠道 Gemini 3

Gemini 3 Pro 模型说明（Gemini 3 Pro Model Card） Read More »

SIMA 2：跑在 3D 游戏里的 Gemini 智能体

发表评论 / Tech / NullThought

SIMA 2 本质上是一个「Gemini 驱动的 3D 游戏通用智能体」：它不再只是听话执行指令，而是能在虚拟

SIMA 2：跑在 3D 游戏里的 Gemini 智能体 Read More »

基于AI的规模化数学探索和发现

发表评论 / 科学 / NullThought

论文Mathematical exploration and discovery at scale系统展示了由

基于AI的规模化数学探索和发现 Read More »

BitDistill：LLM权重从FP16量化到1.58-bit，精度基本无损，内存消耗下降显著，推理速度提升

发表评论 / Tech / NullThought

论文BitNet Distillation提出 BitNet Distillation（BitDistill）

BitDistill：LLM权重从FP16量化到1.58-bit，精度基本无损，内存消耗下降显著，推理速度提升 Read More »

LLM 脑腐化（Brain Rot）：碎片化、吸睛但低信息的内容会在持续预训练中“腐蚀”模型的思考链条与长程记忆，且很难被事后微调完全补救

发表评论 / Tech / NullThought

论文LLMs Can Get “Brain Rot”!提出并实证验证“LLM 脑腐化（

LLM 脑腐化（Brain Rot）：碎片化、吸睛但低信息的内容会在持续预训练中“腐蚀”模型的思考链条与长程记忆，且很难被事后微调完全补救 Read More »