Gemini 3 Pro 模型说明(Gemini 3 Pro Model Card)
一、模型定位与总体能力 二、模型架构与训练实现 三、训练数据与数据处理 四、分发与使用渠道 Gemini 3...
Read MoreRoofline:解决不同架构边缘侧(Edge)上模型的编译和部署
Roofline 目前本质上是一家 做“下一代 AI 编译器 + SDK”的边缘算力平台公司,产品形态可以理解...
Read MoreTinyFish:“企业级 Web Agent(网页/电脑操作智能体)”平台公司
公司概况 TinyFish 是一家做“企业级 Web Agent(网页/电脑操作智能体)”的平台公司,定位为“...
Read More关于OpenAI Codex的工作模式、Token配置速率、所集成模型
一、工作模式 有三种模式: 何时用哪种? 小提示 二、Token配额速率 下图是 Codex(VS Code...
Read More创新的供应链风险分析:先用知识图谱检索,再把检索到的“经济上最有意义”的子图喂给LLM/RAG
论文Exploring Network-Knowledge Graph Duality: A Case Stu...
Read MoreBitDistill:LLM权重从FP16量化到1.58-bit,精度基本无损,内存消耗下降显著,推理速度提升
论文BitNet Distillation提出 BitNet Distillation(BitDistill)...
Read MoreLLM 脑腐化(Brain Rot):碎片化、吸睛但低信息的内容会在持续预训练中“腐蚀”模型的思考链条与长程记忆,且很难被事后微调完全补救
论文LLMs Can Get “Brain Rot”!提出并实证验证“LLM 脑腐化(...
Read More




