术语表
术语表
相关源文件
本章引用的主要源码文件:
.env.template.github/workflows/dockerhub-mcp.ymlDockerfileREADME.mdassets/cognee_benefits.pngcognee-mcp/Dockerfilecognee-mcp/README.mdcognee-mcp/entrypoint.shcognee-mcp/pyproject.tomlcognee-mcp/src/__init__.pycognee-mcp/src/client.pycognee-mcp/src/cognee_client.pycognee-mcp/src/server.pycognee-mcp/uv.lockcognee/alembic/versions/7c5d4e2f8a91_add_parent_user_id_to_users.pycognee/api/v1/add/add.pycognee/api/v1/cognify/cognify.pycognee/api/v1/config/config.pycognee/base_config.pycognee/context_global_variables.pycognee/infrastructure/databases/graph/config.pycognee/infrastructure/databases/graph/get_graph_engine.pycognee/infrastructure/databases/graph/graph_db_interface.pycognee/infrastructure/databases/graph/kuzu/adapter.pycognee/infrastructure/databases/graph/neo4j_driver/adapter.pycognee/infrastructure/databases/utils/get_or_create_dataset_database.pycognee/infrastructure/databases/vector/chromadb/ChromaDBAdapter.pycognee/infrastructure/databases/vector/config.pycognee/infrastructure/databases/vector/create_vector_engine.pycognee/infrastructure/databases/vector/get_vector_engine.pycognee/infrastructure/databases/vector/lancedb/LanceDBAdapter.pycognee/infrastructure/databases/vector/pgvector/PGVectorAdapter.pycognee/infrastructure/databases/vector/vector_db_interface.pycognee/infrastructure/llm/config.pycognee/infrastructure/llm/prompts/extract_query_time.txtcognee/infrastructure/llm/structured_output_framework/litellm_instructor/llm/bedrock/adapter.pycognee/infrastructure/llm/structured_output_framework/litellm_instructor/llm/get_llm_client.pycognee/modules/data/models/Data.pycognee/modules/pipelines/operations/pipeline.pycognee/modules/pipelines/operations/run_tasks.pycognee/modules/retrieval/base_retriever.pycognee/modules/retrieval/completion_retriever.pycognee/modules/retrieval/graph_completion_context_extension_retriever.pycognee/modules/retrieval/graph_completion_cot_retriever.pycognee/modules/retrieval/graph_completion_retriever.pycognee/modules/retrieval/graph_summary_completion_retriever.pycognee/modules/retrieval/temporal_retriever.pycognee/modules/retrieval/utils/completion.pycognee/modules/settings/__init__.pycognee/modules/settings/get_settings.pycognee/modules/settings/save_llm_config.pycognee/modules/settings/save_vector_db_config.pycognee/modules/users/authentication/default/default_transport.pycognee/modules/users/authentication/get_api_auth_backend.pycognee/modules/users/authentication/get_client_auth_backend.pycognee/modules/users/models/DatasetDatabase.pycognee/root_dir.pycognee/shared/lru_cache.pycognee/tasks/ingestion/ingest_data.pycognee/tasks/ingestion/save_data_item_to_storage.pycognee/tests/unit/infrastructure/llm/test_get_llm_client.pycognee/tests/unit/modules/retrieval/chunks_retriever_test.pycognee/tests/unit/modules/retrieval/graph_completion_retriever_context_extension_test.pycognee/tests/unit/modules/retrieval/graph_completion_retriever_cot_test.pycognee/tests/unit/modules/retrieval/graph_completion_retriever_test.pycognee/tests/unit/modules/retrieval/rag_completion_retriever_test.pycognee/tests/unit/modules/retrieval/summaries_retriever_test.pycognee/tests/unit/modules/retrieval/temporal_retriever_test.pycognee/tests/unit/modules/retrieval/test_brute_force_triplet_search.pycognee/tests/unit/modules/retrieval/triplet_retriever_test.pycognee/tests/unit/test_add_parent_user_id_migration.pydocker-compose.ymlentrypoint.shpoetry.lockpyproject.tomluv.lock
本页面提供了 Cognee 知识引擎中使用的代码库特定术语、缩写和领域概念的定义。
核心概念
Cognify
将原始入库数据转换为结构化知识图谱的核心过程。它涉及一个多阶段管线:分类、片段切分、实体提取、关系检测和摘要生成 cognee/api/v1/cognify/cognify.py:83-89。该过程通过 run_pipeline 函数进行编排 cognee/api/v1/cognify/cognify.py:12-12。
- 源代码:
cognee.cognify()cognee/api/v1/cognify/cognify.py:43-59
DataPoint
Cognee 中所有数据实体的基础基类。知识图谱中的每个节点或关系数据库中的每条记录都继承自 DataPoint,它提供了内置的元数据、来源追踪和版本控制功能。它被定义为一个 Pydantic BaseModel cognee/infrastructure/databases/vector/pgvector/PGVectorAdapter.py:36-49。
- 源代码:
class DataPointcognee/infrastructure/engine/__init__.py(在cognee/infrastructure/databases/vector/pgvector/PGVectorAdapter.py:15-15中被引用)
三数据库架构
Cognee 使用三种不同类型的数据库来管理上下文:
- 关系型数据库:使用
SQLAlchemyAdapter管理系统状态、用户、数据集和管线运行cognee/infrastructure/databases/vector/pgvector/PGVectorAdapter.py:51-51。 - 向量数据库:存储文本片段和图三元组的嵌入向量,以实现语义搜索
cognee/infrastructure/databases/vector/vector_db_interface.py:26-28。 - 图数据库:存储实体及其关系(三元组),以实现结构化推理
cognee/infrastructure/databases/graph/graph_db_interface.py:1-10。
数据集
数据点的逻辑分组。Cognee 通过将数据分离到不同的数据集中来实现多租户隔离。如果启用了 backend_access_control_enabled,这些数据集可以存储在隔离的数据库实例中 cognee/infrastructure/databases/vector/pgvector/PGVectorAdapter.py:22-22。
来源: cognee/api/v1/cognify/cognify.py:43-89, cognee/infrastructure/databases/vector/pgvector/PGVectorAdapter.py:15-51, cognee/infrastructure/databases/vector/vector_db_interface.py:26-28。
技术术语与行话
| 术语 | 定义 | 代码指针 |
|---|---|---|
| 三元组 | 表示为(主体,谓词,客体)的知识单元。 | cognee/modules/retrieval/graph_completion_retriever.py:1-20 |
| Memify | 用于图谱增强的管线,包括编码规则提取和实体合并。 | cognee/api/v1/cognify/cognify.py:136-150 |
| 来源 | 追踪数据点来源的元数据(哪个用户、哪个任务、哪个管线)。 | cognee/api/v1/cognify/cognify.py:34-34 |
| Instructor | Cognee 使用的库,用于从大语言模型(LLM)响应中提取结构化的 Pydantic 模型。 | pyproject.toml:33-33 |
| MCP | 模型上下文协议(Model Context Protocol)。一种标准,用于 AI 代理将 Cognee 作为工具进行交互。 | cognee-mcp/src/server.py:73-73 |
| Ladybug | 图适配器的内部名称,以前称为 KuzuAdapter。 | cognee/infrastructure/databases/graph/kuzu/adapter.py:1-17 |
来源: cognee-mcp/src/server.py:73-73, cognee/infrastructure/databases/graph/kuzu/adapter.py:1-17, pyproject.toml:33-33。
自然语言空间到代码实体空间
以下图表将高层系统概念映射到其具体的实现类和函数。
数据入库与转换
此图表将用户"记住记忆"的操作映射到内部管线执行。
来源: cognee/api/v1/cognify/cognify.py:12-35, cognee/api/v1/add/add.py:1-25, README.md:128-159, cognee/tasks/storage/__init__.py(在 cognee/api/v1/cognify/cognify.py:27-27 中被引用)。
检索与搜索流程
此图表将"搜索"意图映射到具体的检索器和数据库适配器。
来源: cognee/modules/retrieval/graph_completion_retriever.py:1-30, cognee/infrastructure/databases/graph/get_graph_engine.py:1-20, cognee/infrastructure/databases/vector/create_vector_engine.py:1-20, cognee/infrastructure/databases/vector/lancedb/LanceDBAdapter.py:73-80。
缩写
- CoT:思维链(Chain of Thought)。在
GraphCompletionCotRetriever中使用,用于在图谱上执行多步推理cognee/modules/retrieval/graph_completion_cot_retriever.py:1-15。 - RAG:检索增强生成(Retrieval-Augmented Generation)。Cognee 通过
CompletionRetriever将图谱/向量上下文注入大语言模型(LLM)提示词来实现的通用模式cognee/modules/retrieval/completion_retriever.py:1-10。 - OTEL:OpenTelemetry。用于管线内追踪和可观测性的框架,使用
new_spancognee/api/v1/cognify/cognify.py:34-34。 - DLT:数据加载工具(Data Load Tool)。用于从各种来源入库结构化数据的集成工具
cognee/api/v1/cognify/cognify.py:28-28。 - SSE:服务器发送事件(Server-Sent Events)。MCP 服务器用于实时更新的传输模式
cognee-mcp/src/server.py:166-185。
数据库适配器术语表
| 适配器类 | 数据库类型 | 描述 |
|---|---|---|
LadybugAdapter | 图 | 使用 KuzuDB 的默认本地图数据库(别名为 KuzuAdapter)cognee/infrastructure/databases/graph/kuzu/adapter.py:10-17。 |
LanceDBAdapter | 向量 | 使用 LanceDB 的默认本地向量数据库 cognee/infrastructure/databases/vector/lancedb/LanceDBAdapter.py:73-80。 |
SQLAlchemyAdapter | 关系型 | 通过 SQLAlchemy 处理元数据和系统状态 cognee/infrastructure/databases/vector/pgvector/PGVectorAdapter.py:51-51。 |
PGVectorAdapter | 向量 | 用于带有 pgvector 扩展的 PostgreSQL 的适配器 cognee/infrastructure/databases/vector/pgvector/PGVectorAdapter.py:51-55。 |
ChromaDBAdapter | 向量 | 用于 ChromaDB 向量存储的适配器 cognee/infrastructure/databases/vector/chromadb/ChromaDBAdapter.py:1-20。 |
来源: cognee/infrastructure/databases/vector/pgvector/PGVectorAdapter.py:51-55, cognee/infrastructure/databases/vector/lancedb/LanceDBAdapter.py:73-80, cognee/infrastructure/databases/graph/kuzu/adapter.py:10-17, pyproject.toml:40-52。