记忆概览
Agent 记忆服务会将写入的信息组织为不同类型的记忆。
| 记忆类型 | 存储内容 | 示例 |
|---|---|---|
| 客观事实 | 来自外部来源的客观事实 | "Alice 在 Google 工作" |
| 主观经验 | Agent 或用户在交互中产生的行为、偏好和决策 | "我向 Bob 推荐了 Python" |
| 观察 | 从多条事实和经验中自动合并出的高层模式 | "用户偏好暗色模式和 Vue.js" |
这三类记忆构成了从"原始信息"到"高层知识"的记忆层级。系统不是简单保存文本,而是会根据内容性质、重复程度和使用频率,对记忆进行整理和提升。
检索阶段的记忆召回
Agent 记忆服务在执行检索时,会并行检索三类记忆内容:客观事实、主观经验和观察。
如果调用方未指定检索类型,系统默认会将客观事实、主观经验和观察同时纳入候选池。进入候选池的每一类记忆,都会参与多种检索策略,包括向量语义检索、BM25 关键词检索、图谱检索和时间检索。
整体流程可以概括为:
三类记忆进入候选池 → 多维检索 → RRF 融合 → 重排序 → 按 token budget 截断返回
反思阶段的记忆提炼
Agent 记忆服务会自动管理记忆的知识层级。随着更多信息在存储阶段被写入,系统不会只保存一条条孤立的文本,而是会将分散的原始事实逐步整理为更高层、更稳定的知识结构。
整体过程可以理解为:
客观事实 + 主观经验 → 观察 → 心智模型
客观事实 + 主观经验
客观事实和主观经验共同构成记忆库中的基础信息:客观事实是来自外部来源的客观信息,例如文档、网页、知识库或业务资料中的事实内容;主观经验是 Agent 与用户交互过程中产生的信息,例如用户行为、偏好、选择、反馈和决策记录。
观察
系统从多条事实和经验中自动合并、归纳出的高层模式与规律。当多条事实和经验反复指向同一个模式时,系统会将它们整合为观察。例如,用户反复表达相似偏好,系统可以将这些分散事实提炼为更稳定的用户偏好。支持某个观察的证据越多,该观察的置信度和检索优先级会越高。
心智模型
面向常见问题或总结类问题生成的综合摘要,代表更高层级的结构化知识。对于经常被询问的总结类问题,系统可以基于观察进一步生成心智模型,用于提供更精炼、更稳定、更一致的综合回答。详细介绍见心智模型
使用优先级
在反思阶段,系统会按照记忆层级和相关性使用信息:
优先检查心智模型 → 其次使用观察 → 最后回到原始事实和经验
这种机制可以减少重复检索和重复推理,使回答更加高效、稳定,并保持更好的上下文一致性。
评价此篇文章
