浅谈视觉语言模型(Vision-Language Models, VLMs)
视觉语言模型(Vision-Language Models, VLMs)是同时处理视觉信息和文本信息的深度学习 […]
浅谈视觉语言模型(Vision-Language Models, VLMs) Read More »
视觉语言模型(Vision-Language Models, VLMs)是同时处理视觉信息和文本信息的深度学习 […]
浅谈视觉语言模型(Vision-Language Models, VLMs) Read More »
论文FACTS About Building Retrieval Augmented Generation-b
“FACTS”框架:基于检索增强生成(RAG)的聊天机器人构建框架 Read More »
论文Gradient-based Jailbreak Images for Multimodal Fusion
利用越狱图像(Jailbreak Images)攻击多模态融合模型 Read More »
近日,Meta发布了多媒体基础模型集Movie Gen,号称最先进(the most advanced med
Movie Gen:来自Meta的先进多媒体基础AI模型集 Read More »
空间计算(spatial computing)和人工智能(AI)的进展为扩展现实(extended reali
AOI(Augmented Object Intelligence):增强对象智能 Read More »