agentic_huge_data_base / wiki
页面 2.5 参考项目分类与关键要点·方案结构与参考项目

2.5 参考项目分类与关键要点

本页只回答“为什么选这些项目、怎么分类、分别借鉴什么”。已有 11 个项目进入 DeepWiki 中文译文库,LongParser、Hindsight、MemOS 作为补充参考项目,用于能力补洞和机制对照,不计入 2.6 译文完成数。

项目数量14 个 已译项目11 个 章节覆盖601/601 页 补充参考3 个
相关来源文件
  • ai_agent_huge_data_report/docs/13-reference-projects-deepwiki-granularity.md · 参考项目关键要点。
  • ai_agent_huge_data_report/deepwiki_crawl/manifest.json · DeepWiki 仓库、章节、源码线索。
  • ai_agent_huge_data_report/deepwiki_fulltext_zh_status.json · 中文译文覆盖状态。

从需求到项目的逻辑关系

图 2.5 · 参考项目与企业资料知识中枢能力链路。虚线表示补充参考项目,先验证机制,不进入 DeepWiki 完整译文统计。
图 2.5 · 参考项目与企业资料知识中枢能力链路。虚线表示补充参考项目,作为机制参考,不进入 DeepWiki 完整译文统计。

模块分类

文档治理与复核

先解决资料如何进入系统、如何保持权限与版本、如何由人确认事实。

应用、检索与解析

再解决复杂文档如何解析、证据如何被召回,以及如何接入业务应用。

图谱、记忆与运行时

最后验证长期记忆、时序事实、图谱增强召回和代理式研究工作台。

项目清单

项目层级定位阶段重点借鉴DeepWiki 中文译文
2.5.1 Paperless-ngx资料入库文档归档与消费管道一期可借鉴消费目录、派生文本、自动分类候选、原件与衍生物关系。译文 22/22 完整
2.5.2 Mayan EDMS文档治理企业电子文档治理一期治理模型借鉴文档容器、版本链、对象级权限、可查询工作流。译文 25/25 完整
2.5.3 Argilla人审反馈人工复核与反馈数据一期可接入建议与确认分离、反馈数据集、低置信样本队列。译文 28/28 完整
2.5.4 Dify应用编排应用编排与外部知识接入二期验证外部知识接口、工作流、工具调用、应用级日志。译文 68/68 完整
2.5.5 RAGFlow文档解析复杂文档理解与引用检索二期算法验证版面解析、片段可视化、引用定位、解析版本化。译文 62/62 完整
2.5.6 Onyx连接器与搜索企业连接器与统一搜索一期连接器借鉴连接器生命周期、同步游标、权限快照、搜索与对话双入口。译文 73/73 完整
2.5.7 Graphiti时序图谱时序知识图谱与动态事实记忆三期研究实体、关系、事件、时间边、事实失效判断。译文 52/52 完整
2.5.8 Mem0智能体记忆长期记忆与上下文管理三期研究用户记忆、会话摘要、作用域隔离、记忆删除。译文 82/82 完整
2.5.9 Cognee记忆管道记忆管道与知识图谱构建二期后段验证添加、认知化、图谱、向量化、可更新索引。译文 83/83 完整
2.5.10 LightRAG图谱检索轻量图谱增强检索二期算法验证实体抽取、关系抽取、混合召回、图索引。译文 52/52 完整
2.5.11 jcode代理运行时代理式研究运行时二期后段到三期验证工具注册、会话日志、上下文压缩、人工审批、多智能体协作。译文 54/54 完整
2.5.12 LongParser长文档解析LangGraph 式长文档抽取与复核二期补充参考长文档任务图、章节切分、证据锚点、低置信度复核。译文库外
2.5.13 Hindsight代理学习记忆从任务成功和失败轨迹中学习三期补充参考经验记忆、失败模式、相似任务召回、计划前风险提示。译文库外
2.5.14 MemOSMemory OS智能体记忆控制面三期补充参考记忆分层、生命周期、适配器、召回审计和删除策略。译文库外

补充项目定位

项目为什么加入与现有项目的区别当前处理
LongParser补长文档解析任务图和人工复核链路。RAGFlow 更偏完整 RAG 平台,LongParser 更适合看长文档抽取编排。2.5.12 项目要点;译文库外。
Hindsight补代理从成功/失败任务轨迹中学习的经验记忆。Mem0 保存长期记忆,Hindsight 保存“怎么做/哪里错”的任务经验。2.5.13 项目要点;译文库外。
MemOS补 Memory OS 和记忆生命周期控制面。Cognee 偏记忆管道,MemOS 偏统一策略、适配器和生命周期。2.5.14 项目要点;译文库外。

阅读顺序

  1. 先看文档治理链路:Paperless-ngx -> Mayan EDMS -> Argilla -> Onyx。
  2. 再看检索与解析链路:RAGFlow -> Dify -> LightRAG -> LongParser。
  3. 最后看研究能力链路:Graphiti -> Mem0 -> Cognee -> jcode -> Hindsight -> MemOS。