TUMIX(Tool-Use Mixture):多代理并行+多轮迭代,稳态提升推理表现
大模型在推理任务中已可调⽤代码解释器与搜索等外部工具,但“何时用文本推理、何时写代码、何时检索、以及如何把这些...
Read More对比:OpenEvidence vs Glass Health / Medwise / UpToDate / ClinicalKey AI
维度 OpenEvidence Glass Health Medwise UpToDate (Wolters...
Read More用“上下文内微调(In-Context Fine-Tuning, ICF)”方法改进TimesFM(跨领域零样本预测的时序基础模型)
论文In-Context Fine-Tuning for Time-Series Foundation Mod...
Read More“测试时扩散”框架(Test-Time Diffusion Deep Researcher, TTD-DR):通过“草稿—去噪—检索—自进化”,提升长篇研究报告生成质量
当前“深度研究(Deep Research, DR)”型智能体在撰写复杂、长篇的研究报告时,常依赖通用的测试时...
Read MoreAnalog Foundation Models(模拟基础模型):让LLM适配有噪、低精度模拟硬件
现有大模型在推理阶段能耗高、吞吐受限。模拟存内计算(AIMC)通过在非易失存储器阵列内并行完成矩阵–向量乘,实...
Read MoreWorld Labs:“空间智能”(spatial intelligence)公司
一、基本信息与创始背景 二、技术方向与产品愿景 World Labs 致力于开发一种被称为 “Large Wo...
Read MoreBEHAVIOR-1K:面向“人类真实需求”的具身智能/家用机器人基准
BEHAVIOR-1K 是一个面向“人类真实需求”的具身智能/家用机器人基准:它把 1,000 个日常家庭活动...
Read More



