计算机视觉（CV）

利用基础模型（Foundation Models）实现人工生命（Artificial Life）模拟的自动化搜索

发表评论 / Tech, 科学 / NullThought

论文Automating the Search for Artificial Life with Founda […]

利用基础模型（Foundation Models）实现人工生命（Artificial Life）模拟的自动化搜索 Read More »

扩散模型（diffusion model）的泛化源于几何自适应谐波表示（geometry-adaptive harmonic representation）

发表评论 / Tech / NullThought

深度神经网络（Deep Neural Networks, DNNs）通过扩散模型表现出在图像生成和去噪任务中的

扩散模型（diffusion model）的泛化源于几何自适应谐波表示（geometry-adaptive harmonic representation） Read More »

MetaMorph：实现视觉理解与生成统一的多模态模型

发表评论 / Tech / NullThought

论文MetaMorph: Multimodal Understanding and Generation vi

MetaMorph：实现视觉理解与生成统一的多模态模型 Read More »

Genesis：通用机器人/具身人工智能/物理人工智能应用设计的综合性物理仿真平台

发表评论 / Tech / NullThought

Genesis是一个综合性的物理仿真平台，旨在为通用机器人、具身人工智能和物理人工智能应用提供支持。它同时具备

Genesis：通用机器人/具身人工智能/物理人工智能应用设计的综合性物理仿真平台 Read More »

PaliGemma 2: 用于迁移学习的多功能视觉-语言模型（VLM）家族

发表评论 / Tech / NullThought

论文PaliGemma 2: A Family of Versatile VLMs for Transfer（

PaliGemma 2: 用于迁移学习的多功能视觉-语言模型（VLM）家族 Read More »

视觉自回归建模（Visual AutoRegressive, VAR）

发表评论 / Tech / NullThought

论文Visual Autoregressive Modeling: Scalable Image Genera

视觉自回归建模（Visual AutoRegressive, VAR） Read More »