MambaVision:一种新型混合Mamba-Transformer视觉Backbone
Nvidia这两天发布了MambaVision,即一种新型混合Mamba-Transformer视觉Backb...
Read MorePaliGemma:一种可有效进行任务迁移的视觉语言模型(VLM)
PaliGemma 是一个开放的视觉语言模型(VLM),它结合了 SigLIP-So400m 视觉编码器和 G...
Read More四个顶级实践,帮助企业架构(EA)和技术创新(TI)领导者为人工智能(AI)项目增值
Gartner于2023年4月发布题为《4 Top Practices That Help EA/TI Lea...
Read More测试时训练层Test-Time Training(TTT),一种新的序列建模层
自注意力机制在长上下文中表现良好,但其复杂度为二次方。现有的RNN层具有线性复杂度,但其在长上下文中的性能受限...
Read More化学中的LLMs,Large Language Models and Autonomous Agents in Chemistry
论文《A Review of Large Language Models and Autonomous Age...
Read More达索系统(Dassault Systèmes)宣布与Mistral AI合作
近日,达索系统(Dassault Systèmes)宣布与 Mistral AI 建立合作关系,以尖端的人工智...
Read More模型泛化(Model Generalization )与可解释AI(Explainable AI,XAI)
模型泛化(Model Generalization)和可解释AI(Explainable AI,XAI)在机器...
Read MoreSubsonic, supersonic, and hypersonic
The differences between subsonic, supersonic, and hyper...
Read MoreCVPR2024最佳论文:Rich Human Feedback for Text-to-Image Generation
计算机图像和模式识别2024年度大会(Computer Vision and Pattern Recognit...
Read MoreCVPR2024最佳论文:Generative Image Dynamics
计算机图像和模式识别2024年度大会(Computer Vision and Pattern Recognit...
Read More