MetaMorph:实现视觉理解与生成统一的多模态模型
论文MetaMorph: Multimodal Understanding and Generation vi […]
MetaMorph:实现视觉理解与生成统一的多模态模型 Read More »
论文MetaMorph: Multimodal Understanding and Generation vi […]
MetaMorph:实现视觉理解与生成统一的多模态模型 Read More »
Genesis是一个综合性的物理仿真平台,旨在为通用机器人、具身人工智能和物理人工智能应用提供支持。它同时具备
Genesis:通用机器人/具身人工智能/物理人工智能应用设计的综合性物理仿真平台 Read More »
论文PaliGemma 2: A Family of Versatile VLMs for Transfer(
PaliGemma 2: 用于迁移学习的多功能视觉-语言模型(VLM)家族 Read More »
论文Visual Autoregressive Modeling: Scalable Image Genera
视觉自回归建模(Visual AutoRegressive, VAR) Read More »
论文Extending Video Masked Autoencoders to 128 frames(《扩展
扩展和改进视频掩码自动编码器(MAE),实现视频理解效果的增强 Read More »
论文《VLsI: Verbalized Layers-to-Interactions from Large t
VLsI模型:逐层蒸馏,逐层对齐,实现从大规模到小规模视觉-语言模型(VLM)的高效知识迁移 Read More »