凯时AG

当AI账单失控,,,,,,模子路由器成为企业降本新宠

作者:谢逸民
宣布时间:2026-07-05 17:22:39
阅读量:9

当AI账单失控,,,,,,模子路由器成为企业降本新宠

随着企业AI使用本钱一连攀升,,,,,,一类名为"模子路由器"的手艺正迅速从边沿工具走向主流。。。。。这类系统能够凭证使命庞洪水平自动调配最合适的AI模子,,,,,,在不显著牺牲质量的条件下大幅压缩开支,,,,,,正在吸引从首创公司到大型企业的普遍关注。。。。。

模子路由器的焦点逻辑在于:并非所有使命都需要最腾贵的前沿模子。。。。。总结邮件、检索文档等基础事情完全可以交由开源模子或旧版专有模子处理,,,,,,本钱仅为顶级模子的一小部分。。。。。Snowflake和Palo Alto Networks等企业已向The Information证实,,,,,,通过为特定使命替换更廉价的模子,,,,,,实现了可观的本钱节约。。。。。

这一趋势正在催生真实的商业回报。。。。。修建公司McCarthy Building体现,,,,,,通过Palantir的路由工具Evolve,,,,,,其当季AI token使用量较去年同期镌汰了60%。。。。。Palantir自身也披露,,,,,,在一个详细案例中,,,,,,该工具通过将使命从OpenAI的GPT-5.1切换至更小的GPT-5.4 Nano模子,,,,,,将盘算本钱压缩了97%。。。。。

从手动选模子到自动路由:一个行业转折点

模子路由器的看法并非全新,,,,,,但真正走入公共视野,,,,,,是在OpenAI宣布GPT-5之后。。。。。该模子在ChatGPT内部凭证用户提醒的庞洪水平自动在差别模子之间切换,,,,,,将路由逻辑内嵌于产品之中。。。。。以后,,,,,,能够跨多家供应商举行模子调理的路由器最先快速普及。。。。。

现在市场上的路由器形态多样:既有自力产品,,,,,,也有云盘算服务商内置的功效 ??椋,,,,,尚有企业IT部分自行搭建的定制化方案。。。。。这些工具的配合目的是替换用户手动选择模子的操作,,,,,,从而在降低本钱的同时维持输出质量。。。。。

Databricks推出的Unity AI Gateway即是其中一例。。。。。该公司CEO Ali Ghodsi体现,,,,,,这款工具"很是受接待",,,,,,原因在于许多企业"正在以过快的速率耗尽预算"。。。。。Databricks在向客户推出该产品之前,,,,,,已在内部使用了一段时间。。。。。

从首创公司到科技巨头周全入局

路由器赛道正在吸引差别规模的加入者。。。。。据The Information此前报道,,,,,,今年4月,,,,,,提供路由手艺的首创公司OpenRouter完成了1.2亿美元新一轮融资,,,,,,资源市场对这一偏向的热情可见一斑。。。。。

OpenRouter的"自动路由器"凭证用户对本钱与质量的偏好(在0至10的刻度上自行设定)来决议挪用哪个模子。。。。。数据显示,,,,,,该路由器约三分之一的时间会选择谷歌相对廉价的Gemini 2.5 Flash Lite,,,,,,而挪用OpenAI更强盛的GPT-5.5的比例仅约10%。。。。。OpenRouter的自动路由器底层由首创公司Not Diamond提供支持,,,,,,后者专注于为AI编程智能体开发路由系统。。。。。

日本AI实验室Sakana AI近期宣布了一套基于路由器的多模子协同系统。。。。。该系统在测试中将数学问题主要分配给OpenAI的GPT-5.5,,,,,,将科学问题分配给谷歌的Gemini,,,,,,理由是系统判断这两个模子在各自领域优于其他选项。。。。。Sakana AI称,,,,,,该系统整体体现在编程、工程、科学使命和推理等基准测试上与Anthropic的Fable 5和Mythos Preview模子"并驾齐驱"。。。。。

AI编程应用Cognition本周也宣布了新路由器,,,,,,使用其内部基准测试识别差别智能体的相对优势,,,,,,并引入一个"sidekick"智能体处理较简朴的使命。。。。。Cognition体现,,,,,,该路由器在某编程基准测试上抵达了Fable 5的得分水平,,,,,,本钱却低了35%。。。。。

DIY路由,,,,,,低本钱方案同样奏效

并非所有企业都需要购置专业路由产品。。。。 ??⒄呖梢允褂肅laude Code等AI编程智能体自行搭建路由器,,,,,,甚至直接让一个AI模子来决议哪个模子最适合处理某个特定盘问。。。。。

Arcee AI认真AI智能体事情的Hunter Bown体现,,,,,,他习惯使用DeepSeek V4 Flash来举行模子选择,,,,,,原因是其本钱低廉。。。。。他的做法是向DeepSeek提供一份模子列表,,,,,,让其判断哪个模子最适合处理当条件示。。。。。

不过,,,,,,这类"快速搭建"方案也有其局限性。。。。。路由器提供商Martian的首创人Shriyash Upadhyay指出,,,,,,更重大的路由器有时会展示出亮眼的基准测试效果,,,,,,但现实体现未必与之相符。。。。。他还提到,,,,,,即即是更细密的路由器,,,,,,仅凭用户的第一条提醒来展望最佳模子也颇具难度。。。。。

Upadhyay体现,,,,,,模子迭代速率快、能力差别一连转变,,,,,,使得路由决议愈发重大。。。。。"各家公司没有关于所有差别使命的无限数据,,,,,,因此你必需真正深入模子内部,,,,,,弄清晰这些模子善于什么。。。。。"为此,,,,,,Martian在做路由决议时,,,,,,不但参考模子的输出效果,,,,,,还会考量组成这些模子的内部盘算历程。。。。。

本钱压力一连,,,,,,路由器需求料将扩大

企业对AI本钱的焦虑并非短期征象。。。。。随着员工对高级AI模子的使用量(即"tokenmaxxing"征象)一连增添,,,,,,治理层对AI支出的审阅也在增强。。。。。这一配景为模子路由器提供了一连的需求驱动力。。。。。

Palantir的Evolve工具在路由功效之外,,,,,,还能凭证所选模子自动调解提醒内容,,,,,,并防止请求被重复发送给模子——后者是导致逾额收费的常见原因之一。。。。。McCarthy Building的案例批注,,,,,,通过优化提醒结构,,,,,,企业可以在使用前沿模子时消耗更少的token,,,,,,同时获得相同的输出效果。。。。。

关于投资者而言,,,,,,模子路由器赛道的升温意味着:一方面,,,,,,OpenRouter等专注路由手艺的首创公司正在获得资源青睐;;;;;;另一方面,,,,,,Databricks、Palantir等将路由功效整合进企业AI平台的公司,,,,,,也在以此强化其产品竞争力。。。。。随着AI基础设施支出一连扩张,,,,,,资助企业控制这一支出的工具层,,,,,,正在成为不可忽视的新兴市场。。。。。

 

文章点评

未盘问到任何数据!

揭晓谈论

◎接待加入讨论,,,,,,请在这里揭晓您的看法、交流您的看法。。。。。

最新文章

热门文章

随机推荐

【网站地图】