AI Infra:多模态,是搜索和Agent的入口

一、搜索和Agent的未来形式多模态输入 ↓ 隐式 world model(做理解 & 粗推理) ↓ 显式结构层(memory / graph / tool schema)(约束 + 执行) ↓ 决策与执行 ↓ 生成二、三层认知架构:感知+认知+行动2.1 感知层(Perception)多模态 encoder隐式表征特点:高压缩高泛化不精确但强表达2.2 认知层(Cognition)两部分组成:A. 隐式世界模型(latent)处理模糊关系做类比、联想B. 显式结构(memory / graph)存储确定性信息提供约束2.3 行动层(Action)plan...

当各大厂纷纷推出类 openclaw 服务,就有了各种各样的“虾”,加上各种 AI Chatbot、AI Cli,每天要有很多很多孤立的窗口。我们需要属于自己的“集中”记忆。一、为什么 openclaw 类服务必然走向“记忆层分离”先看约束条件,也就是分散的部署:约束本质问...

依然从计算不可约性出发,来分析与现实世界深度交互的具身智能产业,核心的问题是“物理世界中的实时决策任务,是否比纯语言任务更难压缩?”,答案倾向于:是,而且结构上更强。一、不可约性的来源对比维度语言系统具身系统状态空间离散 token连续物理状态反馈延迟可重算实时约束可逆性高...

Agmente 是一款 iOS 原生应用,让开发者能在手机上实时查看远程 AI 编码代理的执行过程(思考、工具调用、结果)定位:AI 编码代理的移动监控伴侣,专为移动场景设计。核心功能:协议连接:支持 Agent Client Protocol (ACP) 和 Codex ...