2.5.9 Cognee
企业知识需要经历添加、认知化、索引、图谱化、检索和更新,不能停在一次向量化。
业务需求记忆构建管道
架构位置作为从文档到向量、图谱和智能体召回的记忆管道参照
落地阶段二期后段验证
相关来源文件
ai_agent_huge_data_report/docs/13-reference-projects-deepwiki-granularity.mdai_agent_huge_data_report/docs/11-reference-platforms-agentic-knowledge-base.md
DeepWiki 中文译文子页
Cognee 的 DeepWiki 中文译文入口
企业知识需要经历添加、认知化、索引、图谱化、检索和更新,不能停在一次向量化。
83/83 页中文译文
译文覆盖完整
系统架构、测试、发布与运维、检索、召回与索引
业务问题与适用场景
企业知识需要经历添加、认知化、索引、图谱化、检索和更新,不能停在一次向量化。
本页从 Cognee 中拆出问题解决方式、对象边界、关键机制和可迁移设计,避免“看过一个开源项目”停留在名词层面。
架构位置与边界
作为从文档到向量、图谱和智能体召回的记忆管道参照。
落地判断
如果该项目能力进入本项目,必须先回答三件事:是否保留现有事实源,是否能继承权限,是否能把每个结论回到来源证据。核心对象与数据模型
| 对象 | 作用 | 本项目映射 |
|---|---|---|
添加Add | 接收资料或数据点进入记忆构建流程。 | memory_inputs |
认知化Cognify | 把原始资料加工成结构化事实、片段、实体和关系。 | cognify_runs |
数据Data Point | 可被检索、关联、引用的最小信息单元。 | data_points |
图谱Graph | 实体关系和事实网络。 | knowledge_graph |
向量索引Vector Index | 语义召回基础设施。 | vector_index |
搜索Search | 面向智能体或应用的召回接口。 | memory_search |
主流程与数据流
图 2.5.9 · Cognee 主流程与数据流。
关键实现机制
| 机制 | 拆解说明 |
|---|---|
| 管道化记忆 | 把记忆构建视为可运行、可重试、可观测的流水线。 |
| 图谱与向量并存 | 语义召回解决相似,图关系解决关联和路径。 |
| 来源追踪 | 每个数据点必须绑定原始资料、处理版本和权限范围。 |
| 面向智能体的召回 | 返回的不只是文本,还要包含关系、来源、置信度和可用工具。 |
技术亮点
- 适合做研究型记忆管道原型。
- 强调从原始资料到结构化记忆的生命周期。
- 能帮助设计后续图谱和向量并行架构。
不适合照搬的部分
- 生产级权限和审计仍需自建。
- 图谱抽取质量需要本地资料评测支撑。
映射到本项目
| 本项目设计点 | 落地说明 |
|---|---|
| 记忆构建任务 | 每次资料入库后触发可重跑的认知化任务。 |
| 数据点注册表 | 把片段、实体、关系、摘要统一登记。 |
| 研究记忆沙箱 | 先在非生产资料域验证图谱和向量联动。 |
验证清单
- 选择一个资料域做端到端验证,比较纯向量召回与图谱加向量召回的证据覆盖率。
依据
术语显示规则
- 正文
- 优先使用中文术语;项目名、接口名和代码字段保留原名。
- 原名
- 原英文名以灰色代码标识显示,便于索引和核对定义,不打断常规阅读。