别再叫它 API 聚合了,它正在控制 AI 世界的“石油管道”

上周和一个做投资的朋友聊天,他抱怨说现在看 AI 项目看到头秃。基础模型那波已经卷成麻花,应用层又虚头巴脑,找不到护城河。

我给他画了张图,他一下就懂了。

我说,你别盯着挖金矿的(模型厂商)和卖水的(云厂商),你应该去看那条“输油管道”。而这条管道里流淌的,不是石油,是 Token。

管道的控制者,我把它叫做 Token Factory(Token 工厂)。OpenRouter、Portkey、LiteLLM Cloud 这些公司,都在这条赛道上。它们生产的不是模型,而是一个标准化的产品:推理 Token

这玩意儿才是 AI 商业化的真正咽喉。为了讲清楚这个逻辑,我把 Token Factory 的商业模式拆成了五层。这五层,从低到高,价值完全不同。


一、最底层:Token 转售,听着像二道贩子,其实是“AI界的Stripe”

最早期,这门生意听起来一点都不性感,甚至有点 low。

说白了,就是个二道贩子。比如 OpenRouter,它自己一个模型都不训。它先从 OpenAI、Anthropic 那儿批量“批发”模型推理能力,再零售卖给我们这些开发者。

用户付 $100
    │
    ▼
OpenRouter(过一手)
    │
    │ 付 $95
    ▼
OpenAI / Anthropic

收入哪来?就挣那 5% 左右的差价和充值手续费。乍一看,这护城河也太浅了,不就是个倒买倒卖的生意吗?

但有意思的地方在于它的定位。它刻意保持 Token 的官方原价,然后靠服务费赚钱。这招非常聪明,它不是在跟模型厂商抢利差,而是在做支付和渠道的基础设施

所以,准确的定义不是“AI 代理商”,而是 AI 时代的 Stripe。它解决的是一个极其无聊但极其重要的问题:让开发者用一行代码,就能接入全世界所有的模型,不用管后面那一堆账单、密钥和对账。

这一层,赚的是辛苦钱,但也是所有故事的起点。


二、第二层:路由,从“管道”到“大脑”,真正值钱的来了

如果只做一层,Token Factory 永远只是个微利的管道工。真正让它开始值钱的,是第二层:Routing(路由)

这玩意儿我天天在用,感受太深了。比如我随手发一个请求:“帮我用 Python 写个二分查找。”

一个好的 Router,它脑子里会瞬间闪过一堆决策:

  • 任务分析:这是一个标准代码任务。
  • 模型匹配:Claude Sonnet 干这活最利索,性价比最高。
  • 成本计算:不用上 GPT-4,浪费钱。
  • 执行:直接把任务甩给 Sonnet。

如果我再问:“帮我研究一下最近 AI 制药的新突破。”

Router 又会立刻判断:这是深度研究任务,得调用具备联网或深度推理能力的模型,比如有 Deep Research 功能的 GPT 或 Gemini。

看到了吗?从此以后,作为用户,我们根本不需要关心模型叫什么。我们只关心三个词:最便宜,最快,最准。

但对企业来说,这背后还有更深的逻辑:成本调度、延迟调度、SLA 调度、自动灾备、多云切换……这些能力让 Router 瞬间从一个管道工,变成了一个指挥交通的操作系统(Inference OS)。护城河一下子就冒出来了——算法和调度数据,是模型厂商自己都无法轻易复制的。


三、第三层:算力市场,当“AI司机”的 Uber

再往下走一层,事情就更有意思了。

现在越来越多的独立推理服务商(Inference Provider)爆发式增长,比如 Groq、Together、Fireworks。他们手里有海量的 GPU,专门优化推理速度,比通用云快得多、也便宜得多。

Token Factory 做了什么?它把这些分散的“算力司机”全部接入了自己的网络。

于是,商业模型变成了一个双边市场:

  • 供给侧:成千上万的 GPU 集群,随时待命。
  • 需求侧:数百万开发者,嗷嗷待哺地发出推理请求。
  • 平台:Token Factory 居中调度,撮合交易。

这像极了 Uber。Uber 不拥有任何一辆车,但它控制了出行服务的调度和定价。Token Factory 也一样,它不拥有任何一块 GPU,但它控制着推理能力的生产和分发。

这也是为什么现在很多投资人不再提“API 聚合”,而开始用 AI Compute Marketplace(AI 算力市场) 这个概念。这个叙事,比卖接口要性感十倍。


四、第四层:Token 财务治理,比“省钱”更重要的是“知道钱花哪儿了”

好了,当一个公司开始大规模使用 AI 时,一个恐怖的场景出现了:Token 花费完全失控。

财务总监会发现,他不知道那 10 万美金的账单是怎么来的。是研发部在疯狂调优?是市场部在批量生成文案?还是某个失控的 Agent 陷入了死循环,一夜之间花掉 800 万 Token?

Token Factory 在这里找到了第四层价值:Token FinOps(Token 成本治理)

他们提供的已经不是一个 API 接口,而是一个管理面板。功能包括:预算、配额、角色权限、实时花费、成本归属、计费仪表盘。谁花的,花了多少,花在哪个模型上,ROI 是多少,一目了然。

这一刀,直接切中了企业级客户的命门。你卖 API,IT 部门可能觉得你在增加他们的工作。但你卖管理和控制,CFO 都会帮你说话。

所以,这一层的产品,已经从“工具”变成了“SaaS 订阅服务”,护城河是企业管理能力


五、第五层:Token 智能,这是终极的“上帝视角”和真正的护城河

以上四层,都是业务和产品上的创新。但最让我觉得恐怖的,是第五层:Token Intelligence(Token 智能)

因为这些平台每天处理着天文数字般的推理请求,它们手里握着全世界最珍贵的数据。比如 OpenRouter,每周处理数万亿 Token,它们能看到:

  • 哪个模型的代码能力被调用得最频繁?
  • 哪个推理服务商最近频繁宕机?
  • 哪种 Prompt 技巧的成功率最高?
  • 哪种类型的 AI 应用正在爆炸式增长?

这太可怕了。这种跨模型的、全局的、真实的推理行为数据,是任何一家模型厂商都绝对拿不到的。

  • OpenAI 只能看到自家 GPT 的表现。
  • Anthropic 只能了解 Claude 的优缺点。
  • 但 OpenRouter 站在上帝视角,看着所有模型在同一个擂台上打群架,知道每一场具体的比分和细节。

这形成了一个无法被超越的数据网络效应:接入的平台越多,数据越厚;数据越厚,路由越准;路由越准,用户越多。从去年开始,OpenRouter 已经开始基于这些数据发布论文,研究超百万亿 Token 的模型真实使用状况了。

这已经不是在卖 Token,而是在掌握 AI 产业的真实脉搏。它的价值,彻底从管道,变成了大脑,又变成了预言家。


总结:一条全新的价值链

所以,别再把它看作一个简单的接口工具了。把视野拉高,它正在形成一条控制“AI 推理经济”的全新价值链。

结合我之前研究的“Token 经济”框架,现在这张图可以画完整了:

  • Model Factory(模型工厂):OpenAI、DeepSeek,生产的是基础模型能力
  • Token Factory(Token 工厂):OpenRouter、Portkey,生产的是通用、可调度的推理 Token
  • Business Token Factory(业务 Token 工厂):将企业散落的数据,持续转化为高价值的、带着业务语义的业务 Token
  • Agent Factory(智能体工厂):Manus、OpenHands 等,拿着上面的推理 Token 和业务 Token,去执行具体的业务动作

结论就是,在 AI 狂飙的时代,谁控制算力、谁控制模型,当然重要。但谁控制了 Token 的生产、调度、结算和运营,谁就掌握了将算力和算法变现的“水龙头”。

OpenRouter 正在做的事,就是让自己从一个卖水管的,变成那个掌握水龙头的总闸。而我们,正在用水龙头的另一边——业务数据——制造出能真正浇灌企业价值的特种水源。

标签:infra, ai

你的评论