基于图的RAG方法实现查询聚焦总结

来自Microsoft Research的最新研究成果：From Local to Global: A Graph RAG Approach to Query-Focused Summarization（《从局部到全局：基于图的RAG方法实现查询聚焦总结》），作者为Darren Edge, Ha Trinh, Newman Cheng, Joshua Bradley, Alex Chao, Apurva Mody, Steven Truitt, Jonathan Larson，均来自微软。

论文内容介绍如下：

摘要

本文提出了一种图检索增强生成（Graph RAG）方法，旨在解决传统RAG系统在处理整个文本语料库的全局问题时的局限性。传统RAG在本地问答中效果显著，但在全局总结任务中则表现不足。提出的Graph RAG方法使用大语言模型（LLM）以两阶段构建基于图的文本索引：首先从源文档中创建实体知识图，然后预生成社区总结。这些社区总结用于生成部分响应，最后汇总成用户查询的最终响应。

引言

在科学发现和情报分析等领域，自动化解析大规模文本语料库的需求日益增加。传统的RAG方法检索与查询相关的本地文本块，但对于全局解析问题则显得不足。本文提出的Graph RAG方法旨在通过利用图的模块化特性进行数据分区，实现全面的全局总结。

方法

Graph RAG流程包含几个关键阶段：

源文档到文本块：提取输入文本并将其分块处理。选择块大小以平衡LLM提取过程的召回率和准确率。
文本块到元素实例：使用多部分LLM提示识别和提取文本块中的图节点和边。
元素实例到元素摘要：将图元素（节点、边、协变量）的实例总结为描述性文本块。
元素摘要到图社区：创建一个同质无向加权图，并使用社区检测算法将该图分区为模块化社区。
图社区到社区摘要：生成图层次结构中每个社区的摘要，提供关于数据集全局结构和语义的见解。
社区摘要到社区答案到全局答案：在给定用户查询的情况下，社区摘要生成部分答案，然后汇总成最终的全局答案。

评估

评估集中在两个数据集（播客转录和新闻文章）上，比较Graph RAG与传统RAG和全局文本总结方法的性能。评估指标包括全面性、多样性、赋能性和直接性。结果表明，Graph RAG在全面性和多样性方面显著优于传统RAG，且中级和低级社区摘要表现最佳。

主要发现

提高全面性和多样性：Graph RAG提供的答案比传统RAG更全面和多样。
可扩展性：该方法在文本语料库大小和查询复杂度方面表现出良好的扩展性。
效率：根级社区摘要的Graph RAG需要更少的上下文令牌，是一种高效的迭代问答解决方案。

讨论与未来工作

作者讨论了评估的局限性，指出需要在不同类型的问题、数据和数据集上进行进一步验证。他们还强调了未来工作的潜力，如增强元素提取提示，探索将嵌入匹配与Map-Reduce总结机制结合的混合RAG方案。

结论

Graph RAG方法成功结合了知识图生成、RAG和查询聚焦总结，支持大规模文本语料库的全局解析。初步评估显示其在全面性和多样性方面相比传统RAG基线有显著改进，并与其他全局方法相比表现良好。对于需要对同一数据集进行多次全局查询的情况，实体图索引中的根级社区摘要提供了一种优于传统RAG且在令牌成本上具有竞争力的数据索引方法。

总结

本文提出了一种新颖的Graph RAG方法用于查询聚焦总结，利用图结构的模块化特性进行数据分区，生成全面、多样的全局查询答案。该方法在多个关键指标上优于传统RAG方法，是各种领域自动化解析复杂查询的有价值工具。

P.S., GraphRAG Accelerator on GitHub: https://github.com/Azure-Samples/graphrag-accelerator/

摘要

引言

方法

评估

主要发现

讨论与未来工作

结论

总结

相关文章：

发表评论 取消回复

发表评论取消回复