AI Infra:Nemori,开源的类人情景记忆系统
用“情节片段”替代传统文本,使 AI 记忆更像人类
一、核心逻辑
基于自然启发(Nature‑Inspired)的情景记忆(episodic memory)系统,将用户交互拆解为结构化的“事件片段”,并以此形式存储和检索,以增强 AI 系统的回忆精准度和连贯性
- 输入:用户对话 → 输出:结构化“事件”
处理流程:
- 分段检测(Episode Boundary Detection)
- 情节生成(Episode Generation)
- BM25 构建索引
- 相关片段检索 + LLM 回答
- LLM 调用最小化:仅用于生成情节,其余纯 BM25
二、关键组件
组件 | 功能简述 |
---|---|
RawEventData | 原始交互数据 |
EpisodeBuilder | 构建对话/活动事件 |
RetrievalService | BM25 检索服务 |
EpisodicMemoryRepository | 支持 DuckDB / 内存存储 |
三、设计理念
来源背景
基于 Tanka.ai 平台中用于记忆索引的内部模块,作为一个 MVP开源
- 模仿人类记忆单元:以“事件”为单位,提升检索信噪比。
- 简化即高效:两条提示词 + BM25,在 LoCoMo 测试中表现对标复杂系统。
- 目标对齐训练数据分布:避免模型与真实交互的分布偏移。
四、性能验证
- 测试基准:LoCoMo(长上下文对话建模)
方法:
- 边界探测 → 情节生成 → 索引 → Top-20 检索 → LLM 回答
- 结果:性能优秀,资源消耗低,实现简单。
五、未来计划
- 引入语义记忆(补全关键信息)
- 相似性聚合 → 高阶长期记忆
- 探索混合检索策略(BM25 + 向量)
https://github.com/nemori-ai/nemori
标签:ai