人工智能AI

大模型在推理任务中已可调⽤代码解释器与搜索等外部工具,但“何时用文本推理、何时写代码、何时检索、以及如何把这些能力组合起来”并无清晰实证范式。现有 Code Interpreter 的实现常在“文本 vs 代码”的取舍上失衡,且学界对“代码+搜索+自推理”的联合利用仍缺系统方法与 Read more
维度OpenEvidenceGlass HealthMedwiseUpToDate (Wolters Kluwer)ClinicalKey AI (Elsevier)核心定位医生用循证搜索/问答 + Visits 就诊工作流 + Deep Consult 研究诊断与治疗计划起草( Read more
结论是:当你的问题涉及“专有、时效、现场/上下文、合规与可追溯、或强工作流耦合”时,垂直 RAG 依然非常有价值;当问题只是大众常识或公开静态知识时,直接用通用大模型更省心。 下面用决策视角把话说透: 一、为什么通用大模型“吃掉一切”的叙事并不成立 二、什么时候“别急着上垂直 R Read more
很多人确实感觉到在 Open WebUI 里“上传文档→建知识库”很慢。主要瓶颈通常不是 WebUI 本身,而是以下环节:① 文档解析(尤其 PDF/扫描件);② 生成向量(嵌入模型速度/是否用到 GPU);③ 写入向量库(所选向量数据库与批量写入设置);④ 你自己的切块(chu Read more
OpenAI 宣布在 ChatGPT 里推出由 Stripe 支持的 Instant Checkout(即刻结账)并开源其底层的 Agentic Commerce Protocol(代理式电商协议)。用户将可以使用Etsy和Shopify在 ChatGPT 中引入的即时结账功能直 Read more
论文In-Context Fine-Tuning for Time-Series Foundation Models聚焦“将多条相关时间序列的少量样例在推理时作为上下文提供给基础模型”,以在零样本/少样本场景下提升预测精度,并避免逐数据集微调的昂贵代价。作者提出一种“上下文内微调 Read more
当前“深度研究(Deep Research, DR)”型智能体在撰写复杂、长篇的研究报告时,常依赖通用的测试时(test-time)扩展算法(如CoT、best-of-n、MCTS、辩论、自反思等),但整体流程往往是“线性或并行的检索→汇总→成文”,缺乏围绕“草稿—检索—反馈—修 Read more
论文How People Use ChatGPT系统刻画了自 2022 年 11 月上线至 2025 年 7 月期间 ChatGPT 消费端(Free/Plus/Pro)的使用结构与扩散轨迹。作者基于隐私保护的自动化分类流程,对代表性对话样本进行多维标注,得到三条主结论:其一,非 Read more
Codex用于加速各种工程任务,包括理解复杂的系统、重构大型代码库、交付新功能以及在紧急期限内解决事件。通过采访OpenAI工程师和分析内部使用数据,文档How OpenAI uses Codex汇编了展示Codex如何帮助团队提高速度、改善工作质量和管理复杂性的用例和最佳实践。 Read more
现有大模型在推理阶段能耗高、吞吐受限。模拟存内计算(AIMC)通过在非易失存储器阵列内并行完成矩阵–向量乘,实现极高的能效与密度,但其先天存在权重编程误差与时变噪声、输入DAC与输出ADC的低比特量化且多为“静态范围”等非理想性,直接把“现成LLM”搬到AIMC往往性能崩塌,难以 Read more
n8n 是一个“可视化 + 可编程”的工作流自动化平台:用节点拖拽连线搭建流程,需要时在节点里写代码(JS/TS)做定制。它既有云服务,也支持完全自托管;内置 400+ 集成与 AI 能力,并提供数千个社区模板可直接导入复用。官方主页与模板库能直观看到定位与生态体量。 一、核心概 Read more
一、基本信息与创始背景 二、技术方向与产品愿景 World Labs 致力于开发一种被称为 “Large World Models”(有时也被简称为 LWMs,即大型世界模型)的 AI 基础模型,这类模型具备以下特点: 三、团队与创始成员 除了李飞飞之外,World Labs 的 Read more