多模态

Unreasonably Effective AI ，“超乎寻常有效”或“不合常理地有效”的AI

发表评论 / Tech, 科学 / NullThought

近期，Google DeepMind的联合创始人兼CEO Demis Hassabis与主持人Hannah F […]

Unreasonably Effective AI ，“超乎寻常有效”或“不合常理地有效”的AI Read More »

HybridRAG：集成知识图谱和向量检索增强生成技术，用于高效信息提取

发表评论 / Tech / NullThought

论文HybridRAG: Integrating Knowledge Graphs and Vector Re

HybridRAG：集成知识图谱和向量检索增强生成技术，用于高效信息提取 Read More »

多模态基础模型中的多样本上下文学习（ManyICL）

发表评论 / Tech / NullThought

论文《多模态基础模型中的多样本上下文学习》（Many-Shot In-Context Learning in

多模态基础模型中的多样本上下文学习（ManyICL） Read More »

通过数据增强对比微调缓解“对象幻觉”（object hallucination）

发表评论 / Tech, 科学 / NullThought

论文Mitigating Object Hallucination via Data Augmented Co

通过数据增强对比微调缓解“对象幻觉”（object hallucination） Read More »

MoMa：自带模态感知组合专家的高效早期融合预训练

发表评论 / Tech, 科学 / NullThought

论文MoMa: Efficient Early-Fusion Pre-training with Mixtur

MoMa：自带模态感知组合专家的高效早期融合预训练 Read More »

PaliGemma：一种可有效进行任务迁移的视觉语言模型(VLM)

发表评论 / Tech, 科学 / NullThought

PaliGemma 是一个开放的视觉语言模型（VLM），它结合了 SigLIP-So400m 视觉编码器和 G

PaliGemma：一种可有效进行任务迁移的视觉语言模型(VLM) Read More »