1 · 总览（Overview）

轻量图谱增强检索 · 聚焦本章的模块关系、源码依据与实现要点。

项目LightRAG 章节1 状态全文译文模块安装与启动、界面与交互、系统架构、检索、召回与索引

源码线索

模块标签

章节正文

LightRAG 编排多个子系统，将原始文档转换为结构化的、可查询的知识库。核心逻辑封装在 LightRAG 类中 lightrag/__init__.py:6。

下图说明了在自然语言和代码实体空间中主要子系统之间的交互方式。

图：子系统互联关系

LightRAG · 高层组件关系 · 图 1

来源： lightrag/lightrag.py, lightrag/operate.py, lightrag/__init__.py:24-38

双层检索： 结合基于图的遍历与向量相似性搜索，提供全面的上下文信息，支持 local、global、hybrid 和 mix 等查询模式 README.md:106-107。
多模态支持： 集成 RagAnything（MinerU/Docling），用于解析来自多种格式的文本、图像、表格和公式 README.md:77-78, 87-88。
角色特定配置： 允许为特定任务分配不同的大语言模型或提供商：EXTRACT、QUERY、KEYWORDS 和 VLM README.md:79-80。
可插拔后端： 支持多种存储解决方案，包括 NetworkX、Neo4j、MongoDB、PostgreSQL（pgvector/AGE）、Milvus 和 OpenSearch README.md:80-81, 90-96。
生产就绪： 包含基于 FastAPI 的服务器（lightrag-server）、基于 React 的 Web 用户界面，以及通过 Langfuse 实现的全面可观测性 README.md:81-82, 94-95。

该引擎处理文档片段切分（固定、递归、向量或段落语义切分），以及实体和关系的提取，以构建知识图谱 README.md:78-79。

LightRAG 实现了一套复杂的检索逻辑，用于管理跨实体和关系的 Token 预算。它支持引用功能，用于来源归属 README.md:89-90。

存储架构通过基类进行抽象，允许在本地基于文件的存储（JsonKV、NanoVectorDB）和分布式数据库之间无缝切换 README.md:80-81, 90-93。

该系统提供 REST API，模拟 Ollama 的接口以兼容 Open WebUI 等工具，同时还提供专用的 Web 用户界面，用于图可视化和文档管理 README.md:94-95, 121-122。

下图展示了数据从输入到代码库中定义的存储实体的转换过程。

图：数据入库流程

LightRAG · 数据流：从文档到知识图谱 · 图 2

来源： README.md:104-105, lightrag/lightrag.py, lightrag/operate.py

要开始使用 LightRAG，请参考以下章节：

来源： README.md:1-150, lightrag/_version.py:1-5