MiroThinker 是 MiroMind AI 推出的「面向深度研究与长时序、工具驱动任务」的开源 agentic 模型系列(含 8B/30B/72B 尺度),并配套开源的 agent 框架(MiroFlow)、训练数据集(MiroVerse)与训练/评估流水线,目标是把连续、多步、工具交互作为性能的第三维(“Interactive Scaling”),以提升长时任务与工具调用场景下的表现。

目前最知名还是技术参数,而是陈天桥投资

https://github.com/MiroMindAI/MiroThinker

试用地址,效果还不错:

https://dr.miromind.ai/

一、产品定位

  • 目标用户:研究者、Agent/Autonomous-agent 开发者、需要多轮检索/工具调用的工程/产品团队(例如需做网络调研、多文档分析、未来事件预测、复杂决策支持的团队)。
  • 要解决的核心痛点:传统大模型在长链路多步交互、大上下文与频繁工具调用(web 检索、代码执行、文件处理等)时容易出错或无法稳定持续执行;MiroThinker 主攻“在环境中反复交互并从外部反馈改正策略”的能力。

二、核心产品能力

  1. 超长上下文 + 长时交互:v1.0 系列宣称支持 256K tokens 的上下文窗口,并针对“深度、多次工具调用”的任务做了优化(可支持数百次 tool calls/任务)。这使得它适合跨多个文档、多轮检索、长期会话的研究任务。(Hugging Face)
  2. 多尺度模型矩阵:提供 8B / 30B / 72B 等版本(方便按算力和成本选型),并在 HuggingFace 上开放权重。(Hugging Face)
  3. Agent-first 框架(MiroFlow)与工具生态:仓库不仅是模型权重,还包含 MiroFlow(agent 框架)、MiroVerse(用于训练的轨迹/偏好数据集)、训练 infra(MiroTrain/MiroRL),帮助把模型和工具(浏览器、检索、执行环境等)连成端到端 agent 产品。
  4. Benchmarks / SOTA 目标:官方给出了在 HLE、BrowseComp、GAIA-Text 等多个“deep-research/agent”基准上的成绩并强调 v1.0 在这些任务上表现领先(即面向“research-grade”能力的度量)。

三、产品架构

  • 模型层:MiroThinker 各尺度权重(基于 Qwen 系列 / 其它大模型骨干的改造),负责生成、推理与内部策略。
  • Agent 框架(MiroFlow):负责任务分解(Planner)、子任务调度(Worklets/Sub-agents)、工具调用管理(浏览器、检索、代码执行、文件操作)、trace 收集与回溯(用于训练与评估)。这是把 model→tool→外部世界闭环化的核心组件。
  • 数据与训练管线:MiroVerse(轨迹/偏好数据集)、MiroTrain / MiroRL(训练与强化学习基础设施),支持 SFT/DPO/RLHF 类混合训练流程以增强交互能力和偏好对齐。
  • 评估与 Benchmark:内置多套 research-oriented benchmark(HLE、BrowseComp、GAIA 等),用于量化“多轮交互/工具调用”能力提升。

四、典型产品化/业务场景

  • 学术/研究助理:自动化长文献综述、多文档合成、证据链检索。
  • 调研/情报分析:通过持续 web-browse + retrieval 实施多跳证据构建。
  • 复杂决策支持:需要跨多数据源长时追踪(如未来事件预测、情景推演)。
  • Agent 平台能力(内部平台化):把 MiroThinker 作为“智能执行层”,在公司内部提供自动化业务流程(带有审计/trace)功能。

五、产品优势

  • 专注agentic & tool-use,不是一个纯粹的对话模型,能够把“外部环境交互”纳入训练目标,产品上更贴近“机器人式任务执行”的需求。
  • 开源(MIT)+生态(模型、框架、数据、训练 infra)相对完备,利于快速做 PoC 与二次开发。
  • 提供多种规模,可根据预算做分层试验(低成本验证后再上大模型)。

标签:infra, ai

你的评论