2.5.13 Hindsight

Hindsight 适合作为“智能体从成功和失败轨迹中学习”的参考样本。它与 Mem0、Graphiti、Cognee 的区别是：重点不是保存用户偏好或企业事实，而是把代理任务执行中的经验、失败原因和可复用策略沉淀为可检索的学习记忆。

业务需求代理任务经验库、失败复盘和策略复用

架构位置智能体运行时之后的学习记忆层，只读取审计后的任务轨迹。

落地阶段三期研究 / 补充参考

译文库范围

本项目不属于当前 DeepWiki 中文译文库范围；本页保留项目定位、可迁移机制与落地要点。

来源

业务问题与适用场景

企业知识中枢的三期能力会出现大量代理式研究任务：跨资料检索、字段抽取、报告草拟、证据校验和多轮澄清。如果每次任务都从零开始，代理会反复犯同样的检索、引用、拆分和工具选择错误。

Hindsight 的价值是把任务执行轨迹转成“经验记忆”：什么检索策略有效、哪些工具调用失败、哪些模型指令容易造成误报、哪些人工审批规则必须提前触发。

Hindsight 只应处理代理运行时产生的审计轨迹，不直接读取 SVN 原文，不保存未确认企业事实。它的输出是任务策略、失败模式和经验摘要，用于下一次代理规划和工具选择。

落地判断

它补齐 jcode 的“运行时有日志”之后的学习闭环：日志不是只用于审计，也可以成为可复用经验，但必须与生产事实库隔离。

图 2.5.13 · Hindsight 对代理任务经验的学习闭环。

机制	拆解说明
结果驱动学习	只有带结果评价的轨迹才值得沉淀，避免把未验证行为写成经验。
经验与事实隔离	经验记忆保存“怎么做”，不保存“企业资料事实是什么”。
相似任务召回	在代理规划阶段召回，而不是在最终回答阶段混入来源不明的上下文。
失败模式库	记录误引、越权、字段幻觉、表格解析失败等可预防错误。

本项目设计点	落地说明
研究任务复盘	每个跨资料问答和报告任务结束后保存轨迹、人工评分和失败原因。
计划前召回	代理开始前检索相似任务经验，生成工具选择和风险提示。
审批阈值调整	遇到历史高风险任务类型时，自动提高人工确认要求。
经验删除与审计	经验记忆必须可删除、可追溯，不允许越权传播项目细节。