2025-10-06 资源资料

ChatDev，虚拟软件公司，一种 P/E 分离的多 agent 实践

用多个AI角色通过聊天协作，自动写代码、测代码、写文档一、核心架构（4层）层级功能关键点Agent角色：CEO、CTO、开发、测试、文档每人有Prompt+职责，用自然语言沟通Chat Chain会话流程控制器决定谁在什么时候说啥，防止跑偏Execution生成代码 + 运行测试输出真实文件（.py/.js），可执行Visualizer对话可视化看清每个agent说了什么、进度如何所有协作基于语言，没有GUI，全是文本交互。二、实施步骤# 1. 克隆 git clone https://github.com/OpenBMB/ChatDev.git && cd ChatDe...

面向人工智能代理的高效上下文工程

《Context Engineering 101》——让AI代理在有限注意力下高效行动🔑 核心洞见AI代理不是靠“更好提示”变聪明，而是靠“更精炼上下文”活下去。LLM的注意力是有限资源（n²复杂度），不是无限记忆。上下文 ≠ 所有信息，而是“最值得看的那几行”。🔄 上下文...

阅读全文

AI Infra：Transformer 模型转换为 SNN 模型的工具调研

将 Transformer 模型（一种基于注意力机制的连续激活人工神经网络，ANN）转换为脉冲神经网络（SNN），本质上是桥接连续计算与离散脉冲编码的范式转变一、脉冲神经网络（SNN）的优缺点1.1 SNN的优点事件驱动、低功耗：仅在有脉冲时进行计算，适合处理稀疏、异步数据...

阅读全文

AI Infra：Logics-Parsing，阿里开源的文档解析OCR模型

一个端到端 Vision-Language 模型，直接把文档图像 → 结构化 HTML（含公式、表格、化学式、手写），取代传统多模块 OCR Pipeline。一、核心价值维度传统方案Logics-Parsing架构多模块串行（布局→OCR→抽取→后处理）单一 VLM 模型...

阅读全文

AI Infra：POINTS-Reader，腾讯开源的文档解析和OCR工具

“用一个语言模型，看图说话，直接吐出结构化文本，靠自打自喂进化。”一、定义端到端视觉-语言OCR：输入一张文档图 → 输出 Markdown + HTML 表格，中间无OCR、无版式分析、无规则引擎。二、架构极简主义组件选择原因视觉编码器NaViT (600M)不是ViT-...

阅读全文

AI Infra：MineContext，字节开源、主动的上下文感知AI伙伴

MineContext 是字节开源的「上下文中台」，把用户/环境/行为的动态状态，统一抽象为可查询、可订阅、可扩展的共享服务，让业务再也不用各自造轮子。Github : https://github.com/volcengine/MineContext一、核心价值把“上下文...

阅读全文

AI Infra：xLLM，京东开源的国产算力LLM推理引擎

京东开源的国产AI加速器专属LLM推理引擎，专为昇腾/海光/飞腾等国产算力优化，服务与引擎解耦架构，支持Qwen/DeepSeek/MoE等主流模型，企业级高吞吐低延迟部署。一、核心机制全图流水线：调度→计算→通信并行，消除气泡动态图优化：变长输入自适应 + 多图缓存 + ...

阅读全文

从2025年上半年大模型推理市场暴涨看下半年投资方向

一、2025年中国大模型推理市场的 5 个趋势2025年中国大模型市场，已从“谁能把模型训出来”，转向“谁能把推理成本压到极致、场景跑得最密”1.1 推理从文本，走向多模态文本仍是主力，但图像、视频推理正快速起量推理输出的token消耗，从文本到图像视频是成百倍的增长1.2...

阅读全文

AI Infra：Anemoi，Coral Protocol 的半中心化多智能体系统（MAS）

Anemoi 是由 Coral Protocol 团队开发的一个创新的半中心化多智能体系统 (MAS)。它通过引入直接的 Agent-to-Agent (A2A) 通信机制，旨在解决传统中心化规划器（Planner）的性能瓶颈，实现更高效、灵活和可扩展的智能体协作。本文将深...

阅读全文

AI Agent的竞争逻辑：从系统边界到投资战略的理性洞察

导语在AI Agent如火如荼的发展浪潮中，技术的复杂性往往掩盖了其本质逻辑。可以从系统论、信息论和控制论三个基础维度出发，重新定义通用型与垂直型AI Agent的竞争路径。通用型 AI Agent + 新硬件（本质是新交互方式） -> 系统性机会垂直型 AI Age...

阅读全文