2.5.13 Hindsight
Hindsight 适合作为“智能体从成功和失败轨迹中学习”的参考样本。它与 Mem0、Graphiti、Cognee 的区别是:重点不是保存用户偏好或企业事实,而是把代理任务执行中的经验、失败原因和可复用策略沉淀为可检索的学习记忆。
业务需求代理任务经验库、失败复盘和策略复用
架构位置智能体运行时之后的学习记忆层,只读取审计后的任务轨迹。
落地阶段三期研究 / 补充参考
译文库范围
本项目不属于当前 DeepWiki 中文译文库范围;本页保留项目定位、可迁移机制与落地要点。业务问题与适用场景
企业知识中枢的三期能力会出现大量代理式研究任务:跨资料检索、字段抽取、报告草拟、证据校验和多轮澄清。如果每次任务都从零开始,代理会反复犯同样的检索、引用、拆分和工具选择错误。
Hindsight 的价值是把任务执行轨迹转成“经验记忆”:什么检索策略有效、哪些工具调用失败、哪些模型指令容易造成误报、哪些人工审批规则必须提前触发。
架构位置与边界
Hindsight 只应处理代理运行时产生的审计轨迹,不直接读取 SVN 原文,不保存未确认企业事实。它的输出是任务策略、失败模式和经验摘要,用于下一次代理规划和工具选择。
落地判断
它补齐 jcode 的“运行时有日志”之后的学习闭环:日志不是只用于审计,也可以成为可复用经验,但必须与生产事实库隔离。核心对象与数据模型
| 对象 | 作用 | 本项目映射 |
|---|---|---|
任务轨迹Agent Trace | 记录代理规划、工具调用、检索命中、模型响应和人工确认。 | agent_traces |
结果评价Outcome | 标记任务成功、失败、部分成功、返工原因和人工评分。 | task_outcomes |
经验记忆Lesson Memory | 从轨迹中提炼出的可复用策略、避坑规则和工具选择建议。 | agent_lessons |
相似任务召回Lesson Retrieval | 新任务规划前召回相似场景的成功策略和失败提醒。 | lesson_search |
主流程与数据流
图 2.5.13 · Hindsight 对代理任务经验的学习闭环。
关键实现机制
| 机制 | 拆解说明 |
|---|---|
| 结果驱动学习 | 只有带结果评价的轨迹才值得沉淀,避免把未验证行为写成经验。 |
| 经验与事实隔离 | 经验记忆保存“怎么做”,不保存“企业资料事实是什么”。 |
| 相似任务召回 | 在代理规划阶段召回,而不是在最终回答阶段混入来源不明的上下文。 |
| 失败模式库 | 记录误引、越权、字段幻觉、表格解析失败等可预防错误。 |
映射到本项目
| 本项目设计点 | 落地说明 |
|---|---|
| 研究任务复盘 | 每个跨资料问答和报告任务结束后保存轨迹、人工评分和失败原因。 |
| 计划前召回 | 代理开始前检索相似任务经验,生成工具选择和风险提示。 |
| 审批阈值调整 | 遇到历史高风险任务类型时,自动提高人工确认要求。 |
| 经验删除与审计 | 经验记忆必须可删除、可追溯,不允许越权传播项目细节。 |
落地要点
- 收集 50 个代理研究任务,人工标记成功、失败和返工原因。
- 验证相似经验召回是否减少重复工具调用、错误引用和无效检索。
- 经验记忆不应包含用户无权再次看到的原文内容。
- 对比启用和禁用经验召回时的任务完成率与人工返工次数。