随着企业AI使用本钱一连攀升,,,一类名为"模子路由器"的手艺正迅速从边沿工具走向主流。。。。这类系统能够凭证使命庞洪水平自动调配最合适的AI模子,,,在不显著牺牲质量的条件下大幅压缩开支,,,正在吸引从首创公司到大型企业的普遍关注。。。。
模子路由器的焦点逻辑在于:并非所有使命都需要最腾贵的前沿模子。。。。总结邮件、检索文档等基础事情完全可以交由开源模子或旧版专有模子处理,,,本钱仅为顶级模子的一小部分。。。。Snowflake和Palo Alto Networks等企业已向The Information证实,,,通过为特定使命替换更廉价的模子,,,实现了可观的本钱节约。。。。
这一趋势正在催生真实的商业回报。。。。修建公司McCarthy Building体现,,,通过Palantir的路由工具Evolve,,,其当季AI token使用量较去年同期镌汰了60%。。。。Palantir自身也披露,,,在一个详细案例中,,,该工具通过将使命从OpenAI的GPT-5.1切换至更小的GPT-5.4 Nano模子,,,将盘算本钱压缩了97%。。。。
从手动选模子到自动路由:一个行业转折点
模子路由器的看法并非全新,,,但真正走入公共视野,,,是在OpenAI宣布GPT-5之后。。。。该模子在ChatGPT内部凭证用户提醒的庞洪水平自动在差别模子之间切换,,,将路由逻辑内嵌于产品之中。。。。以后,,,能够跨多家供应商举行模子调理的路由器最先快速普及。。。。
现在市场上的路由器形态多样:既有自力产品,,,也有云盘算服务商内置的功效??????,,,尚有企业IT部分自行搭建的定制化方案。。。。这些工具的配合目的是替换用户手动选择模子的操作,,,从而在降低本钱的同时维持输出质量。。。。
Databricks推出的Unity AI Gateway即是其中一例。。。。该公司CEO Ali Ghodsi体现,,,这款工具"很是受接待",,,原因在于许多企业"正在以过快的速率耗尽预算"。。。。Databricks在向客户推出该产品之前,,,已在内部使用了一段时间。。。。
从首创公司到科技巨头周全入局
路由器赛道正在吸引差别规模的加入者。。。。据The Information此前报道,,,今年4月,,,提供路由手艺的首创公司OpenRouter完成了1.2亿美元新一轮融资,,,资源市场对这一偏向的热情可见一斑。。。。
OpenRouter的"自动路由器"凭证用户对本钱与质量的偏好(在0至10的刻度上自行设定)来决议挪用哪个模子。。。。数据显示,,,该路由器约三分之一的时间会选择谷歌相对廉价的Gemini 2.5 Flash Lite,,,而挪用OpenAI更强盛的GPT-5.5的比例仅约10%。。。。OpenRouter的自动路由器底层由首创公司Not Diamond提供支持,,,后者专注于为AI编程智能体开发路由系统。。。。
日本AI实验室Sakana AI近期宣布了一套基于路由器的多模子协同系统。。。。该系统在测试中将数学问题主要分配给OpenAI的GPT-5.5,,,将科学问题分配给谷歌的Gemini,,,理由是系统判断这两个模子在各自领域优于其他选项。。。。Sakana AI称,,,该系统整体体现在编程、工程、科学使命和推理等基准测试上与Anthropic的Fable 5和Mythos Preview模子"并驾齐驱"。。。。
AI编程应用Cognition本周也宣布了新路由器,,,使用其内部基准测试识别差别智能体的相对优势,,,并引入一个"sidekick"智能体处理较简朴的使命。。。。Cognition体现,,,该路由器在某编程基准测试上抵达了Fable 5的得分水平,,,本钱却低了35%。。。。
DIY路由,,,低本钱方案同样奏效
并非所有企业都需要购置专业路由产品。。。??????⒄呖梢允褂肅laude Code等AI编程智能体自行搭建路由器,,,甚至直接让一个AI模子来决议哪个模子最适合处理某个特定盘问。。。。
Arcee AI认真AI智能体事情的Hunter Bown体现,,,他习惯使用DeepSeek V4 Flash来举行模子选择,,,原因是其本钱低廉。。。。他的做法是向DeepSeek提供一份模子列表,,,让其判断哪个模子最适合处理当条件示。。。。
不过,,,这类"快速搭建"方案也有其局限性。。。。路由器提供商Martian的首创人Shriyash Upadhyay指出,,,更重大的路由器有时会展示出亮眼的基准测试效果,,,但现实体现未必与之相符。。。。他还提到,,,即即是更细密的路由器,,,仅凭用户的第一条提醒来展望最佳模子也颇具难度。。。。
Upadhyay体现,,,模子迭代速率快、能力差别一连转变,,,使得路由决议愈发重大。。。。"各家公司没有关于所有差别使命的无限数据,,,因此你必需真正深入模子内部,,,弄清晰这些模子善于什么。。。。"为此,,,Martian在做路由决议时,,,不但参考模子的输出效果,,,还会考量组成这些模子的内部盘算历程。。。。
本钱压力一连,,,路由器需求料将扩大
企业对AI本钱的焦虑并非短期征象。。。。随着员工对高级AI模子的使用量(即"tokenmaxxing"征象)一连增添,,,治理层对AI支出的审阅也在增强。。。。这一配景为模子路由器提供了一连的需求驱动力。。。。
Palantir的Evolve工具在路由功效之外,,,还能凭证所选模子自动调解提醒内容,,,并防止请求被重复发送给模子——后者是导致逾额收费的常见原因之一。。。。McCarthy Building的案例批注,,,通过优化提醒结构,,,企业可以在使用前沿模子时消耗更少的token,,,同时获得相同的输出效果。。。。
关于投资者而言,,,模子路由器赛道的升温意味着:一方面,,,OpenRouter等专注路由手艺的首创公司正在获得资源青睐;;另一方面,,,Databricks、Palantir等将路由功效整合进企业AI平台的公司,,,也在以此强化其产品竞争力。。。。随着AI基础设施支出一连扩张,,,资助企业控制这一支出的工具层,,,正在成为不可忽视的新兴市场。。。。
中国国民党、台湾民众党以为,,,民进党版预算规模过大、项目不透明,,,尤其大宗涉及对美采购,,,恐让台湾沦为“美国军工提款机”。。。。