2.5 参考项目分类与关键要点
本页只回答“为什么选这些项目、怎么分类、分别借鉴什么”。已有 11 个项目进入 DeepWiki 中文译文库,LongParser、Hindsight、MemOS 作为补充参考项目,用于能力补洞和机制对照,不计入 2.6 译文完成数。
相关来源文件
ai_agent_huge_data_report/docs/13-reference-projects-deepwiki-granularity.md· 参考项目关键要点。ai_agent_huge_data_report/deepwiki_crawl/manifest.json· DeepWiki 仓库、章节、源码线索。ai_agent_huge_data_report/deepwiki_fulltext_zh_status.json· 中文译文覆盖状态。
从需求到项目的逻辑关系
图 2.5 · 参考项目与企业资料知识中枢能力链路。虚线表示补充参考项目,作为机制参考,不进入 DeepWiki 完整译文统计。
模块分类
文档治理与复核
先解决资料如何进入系统、如何保持权限与版本、如何由人确认事实。
- Paperless-ngx文档归档与消费管道 · 译文 22/22
- Mayan EDMS企业电子文档治理 · 译文 25/25
- Argilla人工复核与反馈数据 · 译文 28/28
- Onyx企业连接器与统一搜索 · 译文 73/73
应用、检索与解析
再解决复杂文档如何解析、证据如何被召回,以及如何接入业务应用。
项目清单
| 项目 | 层级 | 定位 | 阶段 | 重点借鉴 | DeepWiki 中文译文 |
|---|---|---|---|---|---|
| 2.5.1 Paperless-ngx | 资料入库 | 文档归档与消费管道 | 一期可借鉴 | 消费目录、派生文本、自动分类候选、原件与衍生物关系。 | 译文 22/22 完整 |
| 2.5.2 Mayan EDMS | 文档治理 | 企业电子文档治理 | 一期治理模型借鉴 | 文档容器、版本链、对象级权限、可查询工作流。 | 译文 25/25 完整 |
| 2.5.3 Argilla | 人审反馈 | 人工复核与反馈数据 | 一期可接入 | 建议与确认分离、反馈数据集、低置信样本队列。 | 译文 28/28 完整 |
| 2.5.4 Dify | 应用编排 | 应用编排与外部知识接入 | 二期验证 | 外部知识接口、工作流、工具调用、应用级日志。 | 译文 68/68 完整 |
| 2.5.5 RAGFlow | 文档解析 | 复杂文档理解与引用检索 | 二期算法验证 | 版面解析、片段可视化、引用定位、解析版本化。 | 译文 62/62 完整 |
| 2.5.6 Onyx | 连接器与搜索 | 企业连接器与统一搜索 | 一期连接器借鉴 | 连接器生命周期、同步游标、权限快照、搜索与对话双入口。 | 译文 73/73 完整 |
| 2.5.7 Graphiti | 时序图谱 | 时序知识图谱与动态事实记忆 | 三期研究 | 实体、关系、事件、时间边、事实失效判断。 | 译文 52/52 完整 |
| 2.5.8 Mem0 | 智能体记忆 | 长期记忆与上下文管理 | 三期研究 | 用户记忆、会话摘要、作用域隔离、记忆删除。 | 译文 82/82 完整 |
| 2.5.9 Cognee | 记忆管道 | 记忆管道与知识图谱构建 | 二期后段验证 | 添加、认知化、图谱、向量化、可更新索引。 | 译文 83/83 完整 |
| 2.5.10 LightRAG | 图谱检索 | 轻量图谱增强检索 | 二期算法验证 | 实体抽取、关系抽取、混合召回、图索引。 | 译文 52/52 完整 |
| 2.5.11 jcode | 代理运行时 | 代理式研究运行时 | 二期后段到三期验证 | 工具注册、会话日志、上下文压缩、人工审批、多智能体协作。 | 译文 54/54 完整 |
| 2.5.12 LongParser | 长文档解析 | LangGraph 式长文档抽取与复核 | 二期补充参考 | 长文档任务图、章节切分、证据锚点、低置信度复核。 | 译文库外 |
| 2.5.13 Hindsight | 代理学习记忆 | 从任务成功和失败轨迹中学习 | 三期补充参考 | 经验记忆、失败模式、相似任务召回、计划前风险提示。 | 译文库外 |
| 2.5.14 MemOS | Memory OS | 智能体记忆控制面 | 三期补充参考 | 记忆分层、生命周期、适配器、召回审计和删除策略。 | 译文库外 |
补充项目定位
| 项目 | 为什么加入 | 与现有项目的区别 | 当前处理 |
|---|---|---|---|
| LongParser | 补长文档解析任务图和人工复核链路。 | RAGFlow 更偏完整 RAG 平台,LongParser 更适合看长文档抽取编排。 | 2.5.12 项目要点;译文库外。 |
| Hindsight | 补代理从成功/失败任务轨迹中学习的经验记忆。 | Mem0 保存长期记忆,Hindsight 保存“怎么做/哪里错”的任务经验。 | 2.5.13 项目要点;译文库外。 |
| MemOS | 补 Memory OS 和记忆生命周期控制面。 | Cognee 偏记忆管道,MemOS 偏统一策略、适配器和生命周期。 | 2.5.14 项目要点;译文库外。 |
阅读顺序
- 先看文档治理链路:Paperless-ngx -> Mayan EDMS -> Argilla -> Onyx。
- 再看检索与解析链路:RAGFlow -> Dify -> LightRAG -> LongParser。
- 最后看研究能力链路:Graphiti -> Mem0 -> Cognee -> jcode -> Hindsight -> MemOS。