人工智能AI

Google Research团队近期发布了CT Foundation工具,该工具的开发是为了使研究人员能够在更少的数据和计算资源的条件下,快速开发基于CT影像的AI模型。 CT扫描(计算机断层扫描)是现代医学诊断中不可或缺的工具。它通过获取人体不同角度的二维切片图像,重建成三维 Read more
论文VisRAG: Vision-based Retrieval-Augmented Generation on Multi-Modality Documents主要探讨了一个名为VisRAG的新型检索增强生成(RAG)管道,旨在解决传统RAG仅基于文本的局限性,无法有效利用文档 Read more
视觉语言模型(Vision-Language Models, VLMs)是同时处理视觉信息和文本信息的深度学习模型,旨在实现计算机对多模态数据的理解和推理能力。VLMs能够将视觉和文本信息进行融合,使模型在处理图像描述、图像问答、跨模态检索等任务中表现得更加智能化和高效。 1. Read more
论文“Global Lyapunov functions: a long-standing open problem in mathematics, with symbolic transformers”提出了一种从随机解生成合成训练样本的新方法,并证明在这些数据集上训练的seq Read more
论文LLM in a flash: Efficient Large Language Model Inference with Limited Memory探讨了在内存受限的硬件设备上如何高效运行大规模语言模型(Large Language Models, LLMs),尤其是利用 Read more
应美国国家科学院的邀请, Tom Mitchell(卡内基梅隆大学,CMU)和Eric Horvitz(Chief Scientific Officer of Microsoft)共同撰写了这篇题为Scientific Progress in Artificial Intelli Read more
论文Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence(《Model Swarms:通过群体智能对LLM专家进行协作搜索适应》)提出了一种新颖的群体智能协作搜索算法来优化和适 Read more
论文L-HYDRA: Multi-Head Physics-Informed Neural Networks(《L-HYDRA: 多头物理信息神经网络》)旨在将多头神经网络(Multi-Head Neural Networks, MH-NNs)引入物理信息神经网络(Physics Read more
经典论文Deep Residual Learning for Image Recognition是计算机视觉领域具有里程碑意义的工作之一。它引入了一种全新的神经网络结构——残差网络(ResNet),解决了深层神经网络中普遍存在的退化问题,极大地提高了深度网络的训练效果和泛化性能。 Read more
论文SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers详细介绍了Sana框架,它是一种用于生成高分辨率(最高可达4096×4096)的文本到图像生成系统。该系统旨在提 Read more
综述论文Machine Learning with Physics Knowledge for Prediction: A Survey(《结合物理知识的机器学习预测方法概述》)深入探讨了如何将物理学知识与机器学习相结合,目的是提高对科学和工业系统的预测能力,尤其是在涉及偏微分方 Read more
近日,Google宣布与凯罗斯能源公司(Kairos Power)签署新的核清洁能源协议,该协议将使小型核反应堆能够为谷歌的AI中心提供所需的能源: 为了加速美国的清洁能源转型,我们正在签署全球首个企业协议,购买凯罗斯能源公司开发的多个小型模块化反应堆(Small Modular Read more