Nvidia这两天发布了MambaVision,即一种新型混合Mamba-Transformer视觉Backbone。针对的MambaVision的研究在论文《MambaVision: A Hybrid Mamba-Transformer Vision Backbone》有具体阐 Read more
PaliGemma 是一个开放的视觉语言模型(VLM),它结合了 SigLIP-So400m 视觉编码器和 Gemma-2B 语言模型。其目标是提供一个多功能的基础模型,能够有效迁移到各种任务,在近40个不同的任务中表现出色,包括标准的 VLM 基准测试以及更专业的任务如遥感和分 Read more
Gartner于2023年4月发布题为《4 Top Practices That Help EA/TI Leaders Add Value to Artificial Intelligence Initiatives》的报告,详细探讨了如何通过企业架构(EA)和技术创新(TI)领 Read more
一、LoRA(Low-Rank Adaptation) LoRA(Low-Rank Adaptation)是一种在机器学习和深度学习领域使用的技术,主要用于在大规模预训练模型(如BERT、GPT等)上进行高效的参数微调。LoRA的核心思想是通过限制模型参数的变化范围来减少微调所需 Read more
来自Roboflow的Piotr Skalski正在研究的足球AI项目⚽,很有趣。实现了如下功能: 1.训练一个自定义目标检测模型来检测球、球员和裁判;2.球员跟踪(尝试使用ByteTRACK、StrongSORT等方法);3.训练一个自定义关键点检测模型来检测足球场的特征点;4 Read more
自注意力机制在长上下文中表现良好,但其复杂度为二次方。现有的RNN层具有线性复杂度,但其在长上下文中的性能受限于其隐藏状态的表达能力。论文Learning to (Learn at Test Time): RNNs with Expressive Hidden States提出了 Read more
论文《MobileLLM:优化适用于设备上使用的十亿参数以下语言模型》(MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases)探讨了在移动设备上部署大语言模型(LLM Read more
来自Microsoft Research的最新研究成果:From Local to Global: A Graph RAG Approach to Query-Focused Summarization(《从局部到全局:基于图的RAG方法实现查询聚焦总结》),作者为Darren Read more
论文《A Review of Large Language Models and Autonomous Agents in Chemistry》,探讨了大型语言模型(LLMs)及其在化学领域中的应用,以及基于LLMs的自主代理在化学研究中的应用和潜力。论文作者为Mayk Cald Read more
近日,来自University of California, Davis的Soroush Abbasi Koohpayegani介绍了他和其他几位作者的研究论文Compact3D: Smaller and Faster Gaussian Splatting with Vector Read more
2024年6月30日,天兵科技(https://spacepioneer.cc)的天龙三号火箭进行试车。试车过程中,一子级火箭脱离发射台升空,并跌落山中后解体。火箭的“试车”变成了“试飞”。问了问ChatGPT 4o对这件事的看法。 回答中规中矩但清汤寡水,有点儿“理中客”味道, Read more
近日,达索系统(Dassault Systèmes)宣布与 Mistral AI 建立合作关系,以尖端的人工智能技术彻底变革行业!🌟🤝 合作将把达索系统产品的虚拟孪生体验和主权云基础设施与 Mistral 强大的大型语言模型(LLMs)结合起来,通过先进的人工智能技术提升其行业解 Read more