计算机视觉（CV）

机器人效用模型（Robot Utility Models, RUM）实现零样本部署（Zero-Shot Deployment）

发表评论 / Tech / NullThought

论文《Robot Utility Models: General Policies for Zero-Shot […]

机器人效用模型（Robot Utility Models, RUM）实现零样本部署（Zero-Shot Deployment） Read More »

MetaEarth：数字地球遥感生成式模型

发表评论 / Tech, 科学 / NullThought

MetaEarth，一种数字地球遥感生成式模型，是北京航空航天大学科研团队的研究成果。该模型可生成全球任意地理

MetaEarth：数字地球遥感生成式模型 Read More »

SPIRE: 基于语义提示驱动的图像修复

发表评论 / Tech / NullThought

论文SPIRE: Semantic Prompt-Driven Image Restoration介绍了一种新

SPIRE: 基于语义提示驱动的图像修复 Read More »

通过数据增强对比微调缓解“对象幻觉”（object hallucination）

发表评论 / Tech, 科学 / NullThought

论文Mitigating Object Hallucination via Data Augmented Co

通过数据增强对比微调缓解“对象幻觉”（object hallucination） Read More »

YouTube-SL-25：一个大规模的开放领域多语言手语平行语料库

发表评论 / Tech / NullThought

论文YouTube-SL-25: A Large-Scale, Open-Domain Multilingua

YouTube-SL-25：一个大规模的开放领域多语言手语平行语料库 Read More »

MambaVision：一种新型混合Mamba-Transformer视觉Backbone

发表评论 / Tech, 科学 / NullThought

Nvidia这两天发布了MambaVision，即一种新型混合Mamba-Transformer视觉Backb

MambaVision：一种新型混合Mamba-Transformer视觉Backbone Read More »