大模型的几何式记忆(Geometric Memory)?
论文“Deep sequence models tend to memorize geometrically; […]
大模型的几何式记忆(Geometric Memory)? Read More »
论文“Deep sequence models tend to memorize geometrically; […]
大模型的几何式记忆(Geometric Memory)? Read More »
论文Understanding Silent Data Corruption in LLM Training研
静默数据损坏(Silent Data Corruption, SDC) Read More »
论文Urania: Differentially Private Insights into AI Use提出
URANIA:严格差分隐私(Differential Privacy, DP)约束下,对海量 LLM 聊天记录做“用例洞察/主题总结”的框架 Read More »
论文Agent0: Unleashing Self-Evolving Agents from Zero Dat
Agent0:不依赖外部标注数据,基于双智能体 + 工具 + 强化学习,让基础模型在推理能力上持续“自我升级” Read More »
一、模型定位与总体能力 二、模型架构与训练实现 三、训练数据与数据处理 四、分发与使用渠道 Gemini 3
Gemini 3 Pro 模型说明(Gemini 3 Pro Model Card) Read More »