SPIRE: 基于语义提示驱动的图像修复
论文SPIRE: Semantic Prompt-Driven Image Restoration介绍了一种新 […]
SPIRE: 基于语义提示驱动的图像修复 Read More »
论文SPIRE: Semantic Prompt-Driven Image Restoration介绍了一种新 […]
SPIRE: 基于语义提示驱动的图像修复 Read More »
论文Mitigating Object Hallucination via Data Augmented Co
通过数据增强对比微调缓解“对象幻觉”(object hallucination) Read More »
论文YouTube-SL-25: A Large-Scale, Open-Domain Multilingua
YouTube-SL-25:一个大规模的开放领域多语言手语平行语料库 Read More »
Nvidia这两天发布了MambaVision,即一种新型混合Mamba-Transformer视觉Backb
MambaVision:一种新型混合Mamba-Transformer视觉Backbone Read More »
PaliGemma 是一个开放的视觉语言模型(VLM),它结合了 SigLIP-So400m 视觉编码器和 G
PaliGemma:一种可有效进行任务迁移的视觉语言模型(VLM) Read More »
近日,来自University of California, Davis的Soroush Abbasi Koo
Compact3D—通过矢量量化实现更小更快的高斯斑点绘制 Read More »