agentic_huge_data_base / wiki
页面 Mem0 · 2 核心架构·DeepWiki 中文全文译文

2 · 核心架构(Core Architecture)

长期记忆与上下文管理 · 聚焦本章的模块关系、源码依据与实现要点。

项目Mem0 章节2 状态全文译文 模块系统架构、模型调用与提供方适配、检索、召回与索引、界面与交互
源码线索
  • Makefile
  • docs/components/vectordbs/config.mdx
  • docs/components/vectordbs/dbs/chroma.mdx
  • docs/components/vectordbs/dbs/qdrant.mdx
  • docs/components/vectordbs/overview.mdx
  • mem0/__init__.py
  • mem0/configs/prompts.py
  • mem0/memory/main.py
  • mem0/memory/storage.py
  • mem0/memory/utils.py
模块标签
  • 系统架构
  • 模型调用与提供方适配
  • 检索、召回与索引
  • 界面与交互
  • 配置治理

章节正文

核心架构

核心架构

相关源文件

本章引用的主要源码文件:

  • Makefile
  • docs/components/vectordbs/config.mdx
  • docs/components/vectordbs/dbs/chroma.mdx
  • docs/components/vectordbs/dbs/qdrant.mdx
  • docs/components/vectordbs/overview.mdx
  • mem0/__init__.py
  • mem0/configs/prompts.py
  • mem0/memory/main.py
  • mem0/memory/storage.py
  • mem0/memory/utils.py
  • mem0/utils/factory.py
  • mem0/vector_stores/configs.py
  • poetry.lock
  • pyproject.toml
  • tests/configs/test_prompts.py
  • tests/memory/test_main.py
  • tests/test_chatty_llm_parsing.py
  • tests/test_main.py
  • tests/test_memory.py
  • tests/test_proxy.py

本文档描述了 Mem0 的架构模式和设计原则,这些设计使其具备可扩展性和模块化特性。重点介绍工厂模式实现、组件实例化系统,以及不同提供方如何集成到框架中。

详细信息请参阅工厂模式与组件系统。支持的完整后端列表请参见提供方生态。配置机制的详细说明请参见配置系统

架构总览

Mem0 的架构围绕模块化组件系统构建,该系统使用工厂模式在运行时选择提供方,涵盖五大核心组件类别:大语言模型(LLM)、向量存储、嵌入器、图谱存储和重排序器。Memory 类(位于 mem0/memory/main.py:172-234)负责编排这些组件,在初始化时通过对应的工厂实例化每个组件。

该架构通过四种关键机制实现可扩展性:

机制实现方式用途
工厂类LlmFactoryEmbedderFactoryVectorStoreFactoryGraphStoreFactoryRerankerFactory(位于 mem0/utils/factory.py:28-284动态实例化特定提供方的实现
提供方注册表provider_to_class 字典(例如 mem0/utils/factory.py:35-53 中的 LLM 映射)将提供方名称映射到实现类
配置系统Pydantic 模型(例如 mem0/configs/base.py:15-102 中的 MemoryConfigmem0/vector_stores/configs.py:6-67 中的 VectorStoreConfig类型安全的配置,支持提供方特定的模式
动态加载load_class() 函数(位于 mem0/utils/factory.py:22-25通过 importlib.import_module() 在运行时导入
记忆类初始化流程

Memory.__init__() 方法展示了所有工厂如何协同构建记忆引擎:

# 简化流程,来自 mem0/memory/main.py:173-234
class Memory(MemoryBase):
    def __init__(self, config: MemoryConfig = MemoryConfig()):
        self.config = config

        # 第 178 行:嵌入器工厂
        self.embedding_model = EmbedderFactory.create(
            self.config.embedder.provider,
            self.config.embedder.config,
            self.config.vector_store.config,
        )

        # 第 183 行:向量存储工厂
        self.vector_store = VectorStoreFactory.create(
            self.config.vector_store.provider,
            self.config.vector_store.config
        )

        # 第 186 行:LLM 工厂
        self.llm = LlmFactory.create(
            self.config.llm.provider,
            self.config.llm.config
        )

        # 第 187 行:SQLite 历史数据库
        self.db = SQLiteManager(self.config.history_db_path)

来源:mem0/utils/factory.py:28-284mem0/vector_stores/configs.py:6-67mem0/memory/main.py:172-234

组件类别与代码结构

下图将系统名称与负责提供方实例化和管理的具体代码实体关联起来。

记忆类初始化与工厂编排
Mem0 · 记忆类初始化与工厂编排 · 图 1
Mem0 · 记忆类初始化与工厂编排 · 图 1

来源:mem0/memory/main.py:172-234mem0/utils/factory.py:28-284pyproject.toml:26-83

工厂模式实现

每个工厂类都遵循一致的模式,包含三个核心方法:create()register_provider()get_supported_providers()create() 方法是实例化组件的主要入口点。

LlmFactory 架构

LlmFactory 类(位于 mem0/utils/factory.py:28-134)展示了所有工厂使用的模式。它定义了用于提供方实例化和注册的类方法。该工厂在 Memory.__init__() 的第 186 行被调用。

LlmFactory 类结构与数据流
Mem0 · LlmFactory 类结构与数据流 · 图 2
Mem0 · LlmFactory 类结构与数据流 · 图 2

provider_to_class 字典(位于 mem0/utils/factory.py:35-53)将提供方名称映射到 (class_path, config_class) 元组。此注册表支持延迟加载,因为实现类仅在 load_class() 在实例化期间被调用时才导入。

来源:mem0/utils/factory.py:28-134mem0/memory/main.py:186

使用 load_class() 进行动态类加载

load_class() 函数(位于 mem0/utils/factory.py:22-25)使用 Python 的 importlib 模块在运行时导入提供方实现。所有工厂的 create() 方法都会调用此函数。

# mem0/utils/factory.py:22-25
def load_class(class_type):
    module_path, class_name = class_type.rsplit(".", 1)
    module = importlib.import_module(module_path)
    return getattr(module, class_name)

这种模式允许 Mem0 在所有组件类型中支持 60 多个提供方,而无需预先安装所有包。ImportError 仅在请求特定提供方时发生,从而通过 pyproject.toml 特性组(pyproject.toml:26-83)实现可选依赖。

来源:mem0/utils/factory.py:22-25pyproject.toml:26-83

提供方注册表系统

每个工厂都维护一个 provider_to_class 字典,将提供方名称映射到实现细节。此注册表是 Mem0 可扩展性的核心。

向量存储工厂注册表

VectorStoreFactory(位于 mem0/utils/factory.py:164-206)展示了最广泛的提供方注册表,包含 24 个以上的向量存储实现。每个注册表条目将提供方名称映射到其实现类路径。

注册表示例(来自 mem0/utils/factory.py:165-189):

provider_to_class = {
    "qdrant": "mem0.vector_stores.qdrant.Qdrant",
    "chroma": "mem0.vector_stores.chroma.ChromaDB",
    "pgvector": "mem0.vector_stores.pgvector.PGVector",
    "valkey": "mem0.vector_stores.valkey.ValkeyDB",
    # ... 其他提供方
}

例如,ValkeyDB 实现位于 mem0/vector_stores/valkey.py:44-825,其配置位于 mem0/configs/vector_stores/valkey.py:4-16

来源:mem0/utils/factory.py:164-206mem0/vector_stores/valkey.py:44-825mem0/configs/vector_stores/valkey.py:4-16

配置校验系统

配置系统使用 Pydantic 模型,采用两层结构:顶层工厂配置类和提供方特定配置类。

VectorStoreConfig 校验模式

VectorStoreConfig 类(位于 mem0/vector_stores/configs.py:6-67)展示了 Pydantic 的 @model_validator 模式,用于运行时提供方校验和配置实例化。

VectorStoreConfig 校验流程
Mem0 · VectorStoreConfig 校验流程 · 图 3
Mem0 · VectorStoreConfig 校验流程 · 图 3

例如,当 provider='valkey' 时,校验器会从 mem0/configs/vector_stores/valkey.py:4-16 导入 ValkeyConfig,并根据其 Pydantic 模式校验配置字典。

来源:mem0/vector_stores/configs.py:6-67mem0/configs/vector_stores/valkey.py:4-16

扩展机制

可以通过使用所有工厂类上可用的 register_provider() 类方法来添加新的提供方,而无需修改工厂代码。这允许自定义实现与 Memory 系统无缝集成。

可用的工厂方法

所有五个工厂都提供相同的运行时扩展接口:

方法签名用途位置
create()create(provider_name, config, **kwargs)实例化提供方各工厂行号不同
register_provider()register_provider(name, class_path, config_class=None)添加自定义提供方LlmFactory112-123
get_supported_providers()get_supported_providers() -> list列出已注册的提供方LlmFactory126-133

来源:mem0/utils/factory.py:112-133mem0/memory/main.py:186