agentic_huge_data_base / wiki
页面 解决方案 Wiki·方案结构与参考项目

企业资料知识中枢 · 解决方案 Wiki

本 Wiki 从总体需求出发,把参考项目分类、项目要点和 DeepWiki 中文译文放在同一条阅读路径里。先看需求与架构,再看 15 个参考项目如何映射到资料入库、治理、检索、人审、图谱、记忆、应用工作台和代理运行时。

参考项目15 个 DeepWiki 译文708/708 页 译文覆盖全部章节均有中文全文译文 主线需求 → 分类 → 项目要点 → 中文译文

总体需求

明确 SVN 事实源、只读采集、文档理解、结构化索引、检索、人审、应用编排和智能体研究的分层关系。
需求与架构
把规则、模型建议和人工确认拆开,形成可追溯的标签与字段事实。
数据治理
描述从 SVN 文件到解析文本、索引、引用回链和审计日志的处理链路。
工程实现

参考项目分类

文档治理与复核

先解决资料如何进入系统、如何保持权限与版本、如何由人确认事实。

应用、检索与解析

再解决复杂文档如何解析、证据如何被召回,以及如何接入业务应用。

图谱、记忆与运行时

最后验证长期记忆、时序事实、图谱增强召回和代理式研究工作台。

补充参考项目

补齐长文档解析、经验学习记忆和记忆控制面,不计入 DeepWiki 全文译文页数。

  • longparser长文档解析任务图 · 补充参考
  • hindsight代理经验学习记忆 · 补充参考
  • memosMemory OS 控制面 · 补充参考

项目要点与译文入口

项目层级定位阶段重点借鉴DeepWiki 中文译文
2.5.1 Paperless-ngx 资料入库 文档归档与消费管道 一期可借鉴 消费目录、派生文本、自动分类候选、原件与衍生物关系。 中文译文 22/22 完整
2.5.2 Mayan EDMS 文档治理 企业电子文档治理 一期治理模型借鉴 文档容器、版本链、对象级权限、可查询工作流。 中文译文 25/25 完整
2.5.3 Argilla 人审反馈 人工复核与反馈数据 一期可接入 建议与确认分离、反馈数据集、低置信样本队列。 中文译文 28/28 完整
2.5.4 Dify 应用编排 应用编排与外部知识接入 二期验证 外部知识接口、工作流、工具调用、应用级日志。 中文译文 68/68 完整
2.5.5 RAGFlow 文档解析 复杂文档理解与引用检索 二期算法验证 版面解析、片段可视化、引用定位、解析版本化。 中文译文 62/62 完整
2.5.6 Onyx 连接器与搜索 企业连接器与统一搜索 一期连接器借鉴 连接器生命周期、同步游标、权限快照、搜索与对话双入口。 中文译文 73/73 完整
2.5.7 Graphiti 时序图谱 时序知识图谱与动态事实记忆 三期研究 实体、关系、事件、时间边、事实失效判断。 中文译文 52/52 完整
2.5.8 Mem0 智能体记忆 长期记忆与上下文管理 三期研究 用户记忆、会话摘要、作用域隔离、记忆删除。 中文译文 82/82 完整
2.5.9 Cognee 记忆管道 记忆管道与知识图谱构建 二期后段验证 添加、认知化、图谱、向量化、可更新索引。 中文译文 83/83 完整
2.5.10 LightRAG 图谱检索 轻量图谱增强检索 二期算法验证 实体抽取、关系抽取、混合召回、图索引。 中文译文 52/52 完整
2.5.11 jcode 代理运行时 代理式研究运行时 二期后段到三期验证 工具注册、会话日志、上下文压缩、人工审批、多智能体协作。 中文译文 54/54 完整
2.5.15 Open WebUI 应用工作台 多模型对话工作台与知识应用入口 二期验证 聊天工作台、RAG 入口、模型聚合、工具调用、权限与审计、管理面板。 中文译文 107/107 完整
2.5.12 longparser 长文档解析 长文档解析任务图 补充参考 任务图、长上下文解析、跨页结构、章节级证据。 补充参考 无 DeepWiki 全文
2.5.13 hindsight 经验记忆 代理经验学习记忆 补充参考 经验日志、失败复盘、策略记忆、复用边界。 补充参考 无 DeepWiki 全文
2.5.14 memos 记忆治理 Memory OS 控制面 补充参考 记忆类型、生命周期策略、适配器、召回审计。 补充参考 无 DeepWiki 全文

推荐阅读路径

  1. 总体判断:系统总览参考项目分类与关键要点决策建议清单
  2. 项目核对:在项目要点页确认它解决什么问题,再进入对应 DeepWiki 中文译文页查看章节、源码锚点和原始链接。
  3. 实现落地:从 Paperless-ngx、Mayan EDMS、Argilla、Onyx 看一期基础能力;从 RAGFlow、Dify、LightRAG、Open WebUI 看二期应用与检索验证;从 Graphiti、Mem0、Cognee、jcode 看图谱、记忆和代理式研究;LongParser、Hindsight、MemOS 作为补充参考。
相关来源文件
  • ai_agent_huge_data_report/docs/00-main-report.md · 技术选型主报告
  • ai_agent_huge_data_report/docs/11-reference-platforms-agentic-knowledge-base.md · 参考平台调研
  • ai_agent_huge_data_report/docs/13-reference-projects-deepwiki-granularity.md · 项目要点拆解
  • ai_agent_huge_data_report/deepwiki_crawl/manifest.json · DeepWiki 仓库与章节索引