多模态基础模型中的多样本上下文学习(ManyICL)
论文《多模态基础模型中的多样本上下文学习》(Many-Shot In-Context Learning in […]
多模态基础模型中的多样本上下文学习(ManyICL) Read More »
论文《多模态基础模型中的多样本上下文学习》(Many-Shot In-Context Learning in […]
多模态基础模型中的多样本上下文学习(ManyICL) Read More »
论文Mitigating Object Hallucination via Data Augmented Co
通过数据增强对比微调缓解“对象幻觉”(object hallucination) Read More »
论文MoMa: Efficient Early-Fusion Pre-training with Mixtur
MoMa:自带模态感知组合专家的高效早期融合预训练 Read More »
PaliGemma 是一个开放的视觉语言模型(VLM),它结合了 SigLIP-So400m 视觉编码器和 G
PaliGemma:一种可有效进行任务迁移的视觉语言模型(VLM) Read More »
论文《A Review of Large Language Models and Autonomous Age
化学中的LLMs,Large Language Models and Autonomous Agents in Chemistry Read More »
计算机图像和模式识别2024年度大会(Computer Vision and Pattern Recognit
CVPR2024最佳论文:Rich Human Feedback for Text-to-Image Generation Read More »