AI Infra：MiroThinker，陈天桥投资的大模型服务

MiroThinker 是 MiroMind AI 推出的「面向深度研究与长时序、工具驱动任务」的开源 agentic 模型系列（含 8B/30B/72B 尺度），并配套开源的 agent 框架（MiroFlow）、训练数据集（MiroVerse）与训练/评估流水线，目标是把连续、多步、工具交互作为性能的第三维（“Interactive Scaling”），以提升长时任务与工具调用场景下的表现。

目前最知名还是技术参数，而是陈天桥投资

https://github.com/MiroMindAI/MiroThinker

试用地址，效果还不错：

https://dr.miromind.ai/

一、产品定位

目标用户：研究者、Agent/Autonomous-agent 开发者、需要多轮检索/工具调用的工程/产品团队（例如需做网络调研、多文档分析、未来事件预测、复杂决策支持的团队）。
要解决的核心痛点：传统大模型在长链路多步交互、大上下文与频繁工具调用（web 检索、代码执行、文件处理等）时容易出错或无法稳定持续执行；MiroThinker 主攻“在环境中反复交互并从外部反馈改正策略”的能力。

二、核心产品能力

超长上下文 + 长时交互：v1.0 系列宣称支持 256K tokens 的上下文窗口，并针对“深度、多次工具调用”的任务做了优化（可支持数百次 tool calls/任务）。这使得它适合跨多个文档、多轮检索、长期会话的研究任务。(Hugging Face)
多尺度模型矩阵：提供 8B / 30B / 72B 等版本（方便按算力和成本选型），并在 HuggingFace 上开放权重。(Hugging Face)
Agent-first 框架（MiroFlow）与工具生态：仓库不仅是模型权重，还包含 MiroFlow（agent 框架）、MiroVerse（用于训练的轨迹/偏好数据集）、训练 infra（MiroTrain/MiroRL），帮助把模型和工具（浏览器、检索、执行环境等）连成端到端 agent 产品。
Benchmarks / SOTA 目标：官方给出了在 HLE、BrowseComp、GAIA-Text 等多个“deep-research/agent”基准上的成绩并强调 v1.0 在这些任务上表现领先（即面向“research-grade”能力的度量）。

三、产品架构

模型层：MiroThinker 各尺度权重（基于 Qwen 系列 / 其它大模型骨干的改造），负责生成、推理与内部策略。
Agent 框架（MiroFlow）：负责任务分解（Planner）、子任务调度（Worklets/Sub-agents）、工具调用管理（浏览器、检索、代码执行、文件操作）、trace 收集与回溯（用于训练与评估）。这是把 model→tool→外部世界闭环化的核心组件。
数据与训练管线：MiroVerse（轨迹/偏好数据集）、MiroTrain / MiroRL（训练与强化学习基础设施），支持 SFT/DPO/RLHF 类混合训练流程以增强交互能力和偏好对齐。
评估与 Benchmark：内置多套 research-oriented benchmark（HLE、BrowseComp、GAIA 等），用于量化“多轮交互/工具调用”能力提升。

四、典型产品化/业务场景

学术/研究助理：自动化长文献综述、多文档合成、证据链检索。
调研/情报分析：通过持续 web-browse + retrieval 实施多跳证据构建。
复杂决策支持：需要跨多数据源长时追踪（如未来事件预测、情景推演）。
Agent 平台能力（内部平台化）：把 MiroThinker 作为“智能执行层”，在公司内部提供自动化业务流程（带有审计/trace）功能。

五、产品优势

专注agentic & tool-use，不是一个纯粹的对话模型，能够把“外部环境交互”纳入训练目标，产品上更贴近“机器人式任务执行”的需求。
开源（MIT）＋生态（模型、框架、数据、训练 infra）相对完备，利于快速做 PoC 与二次开发。
提供多种规模，可根据预算做分层试验（低成本验证后再上大模型）。

标签：infra, ai