人工智能AI

论文VisRAG: Vision-based Retrieval-Augmented Generation on Multi-Modality Documents主要探讨了一个名为VisRAG的新型检索增强生成(RAG)管道,旨在解决传统RAG仅基于文本的局限性,无法有效利用文档 Read more
视觉语言模型(Vision-Language Models, VLMs)是同时处理视觉信息和文本信息的深度学习模型,旨在实现计算机对多模态数据的理解和推理能力。VLMs能够将视觉和文本信息进行融合,使模型在处理图像描述、图像问答、跨模态检索等任务中表现得更加智能化和高效。 1. Read more
论文“Global Lyapunov functions: a long-standing open problem in mathematics, with symbolic transformers”提出了一种从随机解生成合成训练样本的新方法,并证明在这些数据集上训练的seq Read more
论文LLM in a flash: Efficient Large Language Model Inference with Limited Memory探讨了在内存受限的硬件设备上如何高效运行大规模语言模型(Large Language Models, LLMs),尤其是利用 Read more
应美国国家科学院的邀请, Tom Mitchell(卡内基梅隆大学,CMU)和Eric Horvitz(Chief Scientific Officer of Microsoft)共同撰写了这篇题为Scientific Progress in Artificial Intelli Read more
论文Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence(《Model Swarms:通过群体智能对LLM专家进行协作搜索适应》)提出了一种新颖的群体智能协作搜索算法来优化和适 Read more
论文L-HYDRA: Multi-Head Physics-Informed Neural Networks(《L-HYDRA: 多头物理信息神经网络》)旨在将多头神经网络(Multi-Head Neural Networks, MH-NNs)引入物理信息神经网络(Physics Read more
经典论文Deep Residual Learning for Image Recognition是计算机视觉领域具有里程碑意义的工作之一。它引入了一种全新的神经网络结构——残差网络(ResNet),解决了深层神经网络中普遍存在的退化问题,极大地提高了深度网络的训练效果和泛化性能。 Read more
论文SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers详细介绍了Sana框架,它是一种用于生成高分辨率(最高可达4096×4096)的文本到图像生成系统。该系统旨在提 Read more
综述论文Machine Learning with Physics Knowledge for Prediction: A Survey(《结合物理知识的机器学习预测方法概述》)深入探讨了如何将物理学知识与机器学习相结合,目的是提高对科学和工业系统的预测能力,尤其是在涉及偏微分方 Read more
近日,Google宣布与凯罗斯能源公司(Kairos Power)签署新的核清洁能源协议,该协议将使小型核反应堆能够为谷歌的AI中心提供所需的能源: 为了加速美国的清洁能源转型,我们正在签署全球首个企业协议,购买凯罗斯能源公司开发的多个小型模块化反应堆(Small Modular Read more
论文FACTS About Building Retrieval Augmented Generation-based Chatbots详细讨论了如何在企业环境中构建基于检索增强生成(RAG)的聊天机器人,尤其是在NVIDIA内部三个企业聊天机器人的开发过程中遇到的实际挑战和解决 Read more