论文PaliGemma 2: A Family of Versatile VLMs for Transfer(《PaliGemma 2: 用于迁移学习的多功能视觉-语言模型家族》)详细介绍了PaliGemma模型的升级过程。PaliGemma 2基于Gemma 2系列语言模型,是 Read more
论文Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction提出了一种全新的视觉自回归生成框架——视觉自回归建模(VAR),通过多尺度的生成策略,有效解决了传统自回归模型 Read more
论文PINNs4Drops: Convolutional feature-enhanced physics-informed neural networks for reconstructing two-phase flows(“PINNs4Drops: 用卷积特征增强的物理信息 Read more
论文Extending Video Masked Autoencoders to 128 frames(《扩展视频掩码自动编码器至128帧》)研究了如何通过改进的视频掩码自动编码器(MAE)策略来增强视频理解的效果,尤其是在长视频(128帧)上的表现。论文提出了一种适应性解码器掩 Read more
Google DeepMind刚推出了Genie 2。Genie 2是一种基础世界模型,能够生成无限多样的、可控动作和可玩的3D环境,用于训练和评估具身代理。基于单一提示图像,它可以通过键盘和鼠标输入由人类或AI代理进行操控。 Genie 2可以模拟虚拟世界,包括采取任意动作(例 Read more
论文《VLsI: Verbalized Layers-to-Interactions from Large to Small Vision Language Models》提出了一种新型的视觉语言模型家族——VLsI,针对如何在保持模型性能的前提下实现更高效的视觉-语言模型(VL Read more
论文Automatic discovery of optimal meta-solvers via multi-objective optimization《通过多目标优化自动发现最佳元解算器》主要讨论了一种新的方法,通过结合神经算子(Neural Operators)和经典的迭 Read more
论文STAR: Synthesis of Tailored Architectures(《STAR: 合成定制化架构》)提出了一种名为STAR的创新方法,用于优化深度学习模型架构。STAR采用了一种结合新的搜索空间和进化算法(evolutionary algorithm)的方法, Read more
Steve Jurvetson对摩尔定律的分析精辟、深刻,真是洞见,忍不住摘抄如下: Read more
Saab公司与Helsing公司在2024年柏林国际战斗机会议(International Fighter Conference,IFC)上宣布了“Project Beyond”项目,旨在将Helsing开发的先进人工智能(AI)技术集成到JAS 39 Gripen E战斗机中。 Read more
论文Scaling deep learning for materials discovery(《大规模深度学习用于材料发现》)主要研究如何通过扩展深度学习模型的规模来加速新材料的发现,特别是用于固态化学领域的无机晶体材料。论文通过大规模训练图神经网络模型GNoME(Graph Read more
2024年10月1日,Demis Hassabis在《泰晤士报》2024技术峰会上与主持人进行了深入交流。Demis Hassabis在此次访谈中系统地阐述了DeepMind的历史、目标以及在迈向通用人工智能的过程中所面临的挑战。从逻辑系统到深度学习和强化学习的结合,从专用AI模 Read more