AI Infra:纠缠不清的 Context、RAG、Memory
Context、RAG、Memory 不是互斥,而是互补上下文工程用于会话即时优化,RAG用于把权威文档注入生成,长期记忆用于跨会话个性化一、Context/RAG/Memory 一表说明维度上下文工程RAG长期记忆本质控制输入 → 激活模型内在能力引入外部证据 → 抑制幻觉持久化状态 → 构建个体认知数据会话内示例/摘要外部文档库用户历史/事件/偏好持久性临时(策略可存)文档持久,检索临时持久+衰减+删除检索规则/摘要压缩向量+BM25+重排向量+时间+标签检索成本低中(检索+重排)高(存储+合规+维护)延迟几乎无中~高中(取决于索引)核心价值快、准、可控真、可溯个性、连续、忠诚致命风...