AI Infra:PIKE-RAG,微软开源的专业场景的 RAG 框架

https://github.com/microsoft/PIKE-RAGPIKE-RAG(sPecIalized KnowledgE and Rationale Augmented Generation)是微软提出的一套面向工业/专业场景的 RAG 框架核心目标是把检索到的领域知识“原子化/结构化”并逐步构建可追溯的推理(rationale),从而让 LLM 在复杂多跳、多异构专业语料上既“找得准”又“说明得清”一、核心思想与关键模块PIKE-RAG 把传统 RAG 的「直接检索 → 拼接 context → 生成」流程,扩展为一套知识感知的流水线,其主要模块/技术点包括:文档解析(d...

第1部分:重新定义上下文工程——专用记忆架构的创新1.1 上下文工程:从提示管理到动态系统设计早期的上下文工程被定义为对输入大型语言模型(LLM)的文本信息进行精心设计与管理,以引导模型输出更可靠、可控且符合预期的结果。该方法在LLM发展的初期阶段成为性能优化的关键手段。然...

《Context Engineering 101》——让AI代理在有限注意力下高效行动🔑 核心洞见AI代理不是靠“更好提示”变聪明,而是靠“更精炼上下文”活下去。LLM的注意力是有限资源(n²复杂度),不是无限记忆。上下文 ≠ 所有信息,而是“最值得看的那几行”。🔄 上下文...