人工智能AI

DeepMMSearch-R1:通过“多工具、多轮交互”检索增强推理循环,实现面向真实网页的多模态检索/推理一体化

DeepMMSearch-R1:通过“多工具、多轮交互”检索增强推理循环,实现面向真实网页的多模态检索/推理一体化

现实应用中的多模态大模型(MLLM)在知识密集与信息检索型视觉问答任务上常受限于静态训练语料与长尾知识分布,难...
Read More
Paper2Video:从论文自动生成学术展示视频

Paper2Video:从论文自动生成学术展示视频

论文Paper2Video: Automatic Video Generation from Scientif...
Read More
寻路型AI(Wayfinding AI):打造“更像医生”的健康对话系统

寻路型AI(Wayfinding AI):打造“更像医生”的健康对话系统

现代人获取健康信息的入口极多,但也伴随低质信息、理解偏差与焦虑等风险。大型语言模型(LLMs)虽然在医学知识与...
Read More
ReasoningBank:构建“面向推理的记忆”机制,使智能体实现自主进化能力

ReasoningBank:构建“面向推理的记忆”机制,使智能体实现自主进化能力

大型语言模型(LLM)驱动的智能体正被用于长期、持续的真实世界任务(如网页浏览、软件工程自动化),但主流智能体...
Read More

Agentic Design Patterns(《智能体设计模式》)

Agentic Design Patterns(《智能体设计模式》),作者:Antonio Gulli 目录...
Read More
R&D-Agent:系统化、可扩展、解耦合的MLE(Machine Learning Engineering,机器学习工程)智能体架构

R&D-Agent:系统化、可扩展、解耦合的MLE(Machine Learning Engineering,机器学习工程)智能体架构

随着人工智能(AI)和机器学习(ML)的迅猛发展,数据科学领域取得了显著进展,广泛应用于机器翻译、推荐系统、社...
Read More

Diffusion Transformer (DiT)

扩散模型在图像生成上长期以卷积式 U-Net 为主干,但论文Scalable Diffusion Models...
Read More
Personal Health Agent(PHA):面向个人健康的多智能体框架,数据科学、领域专家、健康教练三种智能体协同

Personal Health Agent(PHA):面向个人健康的多智能体框架,数据科学、领域专家、健康教练三种智能体协同

个人健康与日常福祉高度相关,但传统“单体式”对话大模型在面对真实用户的多样化健康诉求(数据解读、医学知识查证、...
Read More
AI让世界的概率运行更显式

AI让世界的概率运行更显式

世界运行本就基于概率,AI让概率运行更显式了。 The world has always run on pro...
Read More

TUMIX(Tool-Use Mixture):多代理并行+多轮迭代,稳态提升推理表现

大模型在推理任务中已可调⽤代码解释器与搜索等外部工具,但“何时用文本推理、何时写代码、何时检索、以及如何把这些...
Read More

垂直行业 RAG 是否有意义?

结论是:当你的问题涉及“专有、时效、现场/上下文、合规与可追溯、或强工作流耦合”时,垂直 RAG 依然非常有价...
Read More

Open WebUI 里“上传文档→建知识库”很慢,如何优化?

很多人确实感觉到在 Open WebUI 里“上传文档→建知识库”很慢。主要瓶颈通常不是 WebUI 本身,而...
Read More