计算机视觉（CV）

ExPLoRA：实现视觉Transformer（ViT）在不完全解冻模型的情况下，继续在新的目标领域进行自监督学习

发表评论 / Tech / NullThought

论文《ExPLoRA: Parameter-Efficient Extended Pre-Training t […]

ExPLoRA：实现视觉Transformer（ViT）在不完全解冻模型的情况下，继续在新的目标领域进行自监督学习 Read More »

MedImageInsight：通用领域医学影像的开源嵌入模型

发表评论 / Tech / NullThought

论文MedImageInsight: An Open-Source Embedding Model for G

MedImageInsight：通用领域医学影像的开源嵌入模型 Read More »

Movie Gen：来自Meta的先进多媒体基础AI模型集

发表评论 / Tech / NullThought

近日，Meta发布了多媒体基础模型集Movie Gen，号称最先进（the most advanced med

Movie Gen：来自Meta的先进多媒体基础AI模型集 Read More »

AOI（Augmented Object Intelligence）：增强对象智能

发表评论 / Tech / NullThought

空间计算（spatial computing）和人工智能（AI）的进展为扩展现实（extended reali

AOI（Augmented Object Intelligence）：增强对象智能 Read More »

Molmo：开源多模态模型

发表评论 / Tech / NullThought

论文Molmo and PixMo: Open Weights and Open Data for State

Molmo：开源多模态模型 Read More »

Octo：开源通用机器人策略模型

发表评论 / Tech, 科学 / NullThought

论文Octo: An Open-Source Generalist Robot Policy探讨了如何设计和开

Octo：开源通用机器人策略模型 Read More »