人工智能AI

论文The Perfect Blend: Redefining RLHF with Mixture of Judges主要讨论了如何通过一种新的后训练范式,称为约束生成策略优化(Constrained Generative Policy Optimization,CGPO),重新 Read more
论文To CoT or not to CoT? Chain-of-thought helps mainly on math and symbolic reasoning是对链式思维(Chain-of-thought, CoT)技术的深入研究,探讨了其在不同任务中的应用效果,特别是 Read more
论文A toolbox for surfacing health equity harms and biases in large language models详尽地介绍了在医疗健康领域识别和评估大型语言模型(LLM)潜在偏见和健康不公平的工具箱及其方法。文章重点在于如何通过人 Read more
论文Bendable non-silicon RISC-V microprocessor详细描述了一个基于非硅技术的可弯曲32位RISC-V微处理器Flex-RV,具有非常重要的创新意义。它为未来低成本、可弯曲的电子产品奠定了基础。 论文作者为Emre Ozer, Jedrzej Read more
论文Octo: An Open-Source Generalist Robot Policy探讨了如何设计和开发一个具备广泛适应性的机器人策略模型,旨在解决传统机器人策略难以泛化的问题。Octo模型由Transformer架构驱动,经过在大规模多机器人操控数据集上的预训练,支持多 Read more
论文Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make Your LLMs Use External Data More Wisely详细探讨了如何将外部数据 Read more
论文Towards Principles of Brain Network Organization and Function主要讨论了大脑网络的组织和功能的基本原则。文章综述了当前在脑网络的统计分析方面取得的进展,基于统计物理学、网络理论和信息论的相关方法,来解析大脑的复杂结构 Read more
论文SciAgents: Automating scientific discovery through multi-agent intelligent graph reasoning提出了一种名为SciAgents的框架,旨在通过多代理系统(Multi-Agent System Read more
论文Large Language Models as Macroeconomists详细探讨了如何利用大型语言模型(LLMs)来分析和预测美国经济的未来走向,特别是2024年中期的通胀、劳动力市场和货币政策发展。论文核心通过使用GPT4o、Gemini Advanced和Clau Read more
论文Beyond Closure Models: Learning Chaotic Systems via Physics-Informed Neural Operators详细探讨了如何使用物理信息神经算子(Physics-Informed Neural Operator,PI Read more
论文DemoStart: Demonstration-led auto-curriculum applied to sim-to-real with multi-fingered robots(《DemoStart: 基于演示的自动课程,用于多指机器人从模拟到现实的转移》)提出了 Read more
论文On the Limits of Agency in Agent-Based Models(《论基于代理的模型中的代理限制》)通过提出AgentTorch框架,为大规模ABMs中的代理行为提供了新的解决方案。通过将大语言模型LLMs作为代理,AgentTorch能够在复杂的社 Read more