Agent0:不依赖外部标注数据,基于双智能体 + 工具 + 强化学习,让基础模型在推理能力上持续“自我升级”
论文Agent0: Unleashing Self-Evolving Agents from Zero Dat...
Read More凸优化(Convex Optimization):用于火箭助推器的回收降落控制
凸优化用在火箭助推器回收降落上,本质上是:把一个本来非常复杂、非线性的“怎么安全、节省燃料地降落”问题,改写成...
Read More新型模型架构HOPE:基于嵌套学习(Nested Learning),在推理和使用过程中也会更新记忆
对于“深度学习”,很多“深度”其实是一种错觉:表面上是网络多了很多层、参数和算力,但真正决定模型能力的,经常是...
Read MoreGemini 3 Pro 模型说明(Gemini 3 Pro Model Card)
一、模型定位与总体能力 二、模型架构与训练实现 三、训练数据与数据处理 四、分发与使用渠道 Gemini 3...
Read More无节制地刷短视频,与注意力和抑制控制等认知功能的中度下降,以及焦虑、压力、抑郁、睡眠和孤独等心理健康的小幅恶化具有稳定相关
论文《Feeds, Feelings, and Focus: A Systematic Review and...
Read MoreRoofline:解决不同架构边缘侧(Edge)上模型的编译和部署
Roofline 目前本质上是一家 做“下一代 AI 编译器 + SDK”的边缘算力平台公司,产品形态可以理解...
Read MoreBlue Origin 新格伦火箭 vs. SpaceX 猎鹰9火箭
一句概括:新格伦 ≈ 重型、体量大、技术更激进但刚刚起步;猎鹰 9 ≈ 体量较小、运力略低,但复用极其成熟、发...
Read MoreTinyFish:“企业级 Web Agent(网页/电脑操作智能体)”平台公司
公司概况 TinyFish 是一家做“企业级 Web Agent(网页/电脑操作智能体)”的平台公司,定位为“...
Read More关于OpenAI Codex的工作模式、Token配置速率、所集成模型
一、工作模式 有三种模式: 何时用哪种? 小提示 二、Token配额速率 下图是 Codex(VS Code...
Read More近期J.K. Rowling 和Emma Watson关于gender identity ideology的分歧
围绕“gender identity ideology(性别认同意识形态)”这一议题,J.K. Rowling...
Read More创新的供应链风险分析:先用知识图谱检索,再把检索到的“经济上最有意义”的子图喂给LLM/RAG
论文Exploring Network-Knowledge Graph Duality: A Case Stu...
Read MoreBitDistill:LLM权重从FP16量化到1.58-bit,精度基本无损,内存消耗下降显著,推理速度提升
论文BitNet Distillation提出 BitNet Distillation(BitDistill)...
Read MoreLLM 脑腐化(Brain Rot):碎片化、吸睛但低信息的内容会在持续预训练中“腐蚀”模型的思考链条与长程记忆,且很难被事后微调完全补救
论文LLMs Can Get “Brain Rot”!提出并实证验证“LLM 脑腐化(...
Read MoreAB-UPT(Anchored-Branched Universal Physics Transformer):具备较高准确性和效率的CFD建模替代
经典CFD(Computational Fluid Dynamics)仿真在汽车与航空航天外流场分析中耗时高、...
Read More












