凯时AG

华尔街激辩“Token经济学”:AI账单失控了吗??

作者:黄仲峰
宣布时间:2026-06-15 05:17:40
阅读量:173

华尔街激辩“Token经济学”:AI账单失控了吗??

一张Token指数图,,,, ,点燃了AI增添和账单失控的焦虑。。。。 。。

这张图是Silicon Data统计的LLM Token支出指数。。。。 。。6月11日,,,, ,它已连跌7天,,,, ,创下今年1月以来最长连跌纪录;;已往12天里,,,, ,有11天是下跌的。。。。 。。

这个指数权衡的是全市场每使用100万枚Token平均支付几多钱——可以明确为市场愿意为AI“付几多钱”的晴雨表。。。。 。。它自去年12月以来翻了一番以上,,,, ,并在2026年5月前一连攀升,,,, ,但近期急转直下。。。。 。。

它触动的不是一个小指标,,,, ,而是整条AI生意链:若是企业最先控制Token账单,,,, ,GPU、DRAM、数据中心和云厂商的资源开支预期,,,, ,会不会被重新定价??

美国宏观战略师Andreas Steno Larsen在6月9日直接把这张图称为“目今全市场最应关注的一张图”,,,, ,并忠言:若是Token定价一连走弱,,,, ,本轮周期中从内存到更普遍的硬件及数据中心生意可能宣告竣事。。。。 。。

这句话戳到了投资者最敏感的神经。。。。 。。但华尔街的看法更为重大和多面,,,, ,Token定价走弱可能并非纯粹的AI需求见顶。。。。 。。

指数下跌是不是需求见顶??这张图究竟表达了什么

这张图不可简朴读成“AI没人用了”。。。。 。。

它不是Token总需求指数,,,, ,也不是Token总支出金额。。。。 。。它量的是每百万Token的加权平均价钱——也就是说,,,, ,它反映的是用户在用什么价位的模子。。。。 。。

算一笔简朴的账就清晰了:假设前沿模子10美元/百万Token,,,, ,自制模子1美元。。。。 。。某个月100单位用量全跑在前沿模子上,,,, ,指数是10。。。。 。。下个月需求翻倍到200,,,, ,但新增的全是自制模子跑的批量使命,,,, ,指数直接掉到5.5。。。。 。。

需求翻倍,,,, ,指数腰斩。。。。 。。

这意味着,,,, ,指数下跌有两种完全差别的诠释:一是需求真的在萎缩;;二是用量在爆炸,,,, ,但用户在自动向低价模子迁徙。。。。 。。

这正是目今争论的焦点:指数下跌,,,, ,究竟是需求见顶,,,, ,照旧用量结构下沉??

Citadel证券宣布《Tokenomics》报告以为,,,, ,AI落地的焦点约束已从"模子能力"转向"本钱与算力稀缺",,,, ,用户正加速向廉价模子迁徙。。。。 。。

“接纳趋势越来越不取决于前沿模子的功效,,,, ,而更多取决于价钱……Token指数的近期下跌可能反映了这种向更自制模子转变的部分迹象。。。。 。。”

摩根大通TMT剖析师Mark Schilsky则在6月11日把近期市场讨论概括为:“AI账单失控了。。。。 。。”同时,,,, ,该行以为目今的Token支出乱象只是“通往更高支出的最小减速带”。。。。 。。

Citadel的判断:AI的“性价比与稀缺性”变得更主要了

Citadel证券在其最新宣布的《Tokenomics》报告中,,,, ,给出了一个明确的偏向性判断。。。。 。。

焦点论点是:AI落地的焦点约束,,,, ,已经从"模子能力"转向了"本钱与稀缺性"。。。。 。。

Citadel的表述是:“手艺落地的焦点不再是前沿模子理论上能做什么,,,, ,而是规;;迪諥I运行所需的投入品的价钱与稀缺性。。。。 。。算力、电力、冷却、内存带宽和推理预算,,,, ,都是真实保存且具有约束力的限制条件。。。。 。。”

报告援引经济学基来源理:价钱有三大功效——转达稀缺信号、催生替换动力、将资源设置到价值最高的用途。。。。 。。这三条在AI领域正在同时爆发。。。。 。。

结论是:未来最好的回报,,,, ,不会来自那些构建最强模子的公司,,,, ,而是来自那些降低AI本钱、提升效率的公司。。。。 。。

同时,,,, ,推理麋集型前沿AI不会消逝,,,, ,但会越来越集中在少数有能力肩负本钱的大型企业手中。。。。 。。对整个经济体而言,,,, ,在物理约束缓解之前,,,, ,更简朴的模子可能是更具生产力的路径。。。。 。。

低价模子正在改变账单结构

高盛One-Delta部分认真人Rich Privorotsky曾提到,,,, ,DeepSeek下调75%的定价,,,, ,小米MiMo靠近99%的降价幅度,,,, ,基础设施瓶颈缓解正在触发价钱战。。。。 。。

Coinbase首席执行官Brian Armstrong展望,,,, ,未来12至18个月,,,, ,80%的AI事情负载会迁徙到本钱低99%的模子上,,,, ,只有20%需要极致智能的使命会继续留在前沿模子上。。。。 。。

Hugging Face首席执行官Clement Delangue援引斯坦福大学数据称,,,, ,外地模子在真实天下盘问中的准确率已升至71.3%,,,, ,且本钱极低。。。。 。。

这与Citadel的判断相靠近:前沿AI不会消逝,,,, ,但可能集中在少数能遭受算力本钱、具备研究深度、且能把高难度问题转化为规;;找娴钠笠凳种。。。。 。。

对更普遍的经济体而言,,,, ,在物理约束缓解前,,,, ,更简朴的模子可能是更自制的生产力工具。。。。 。。

也就是说,,,, ,AI使用可能走向分层。。。。 。。

高价值、重大使命继续使用前沿模子。。。。 。。日常使命、批量使命、低回报实验,,,, ,则转向自制模子或外地模子。。。。 。。

摩根大通:优化账单,,,, ,不即是AI需求见顶

摩根大通的判断则是:现在的账单焦虑,,,, ,可能只是AI需求早期阶段的小减速带;;一年后Token支出可能显着更高。。。。 。。

若是每百万Token平均本钱下降,,,, ,但美国公司AI付费渗透率仍在上升,,,, ,总Token用量在算术上就必需大幅增添。。。。 。。也就是说,,,, ,“单位价钱下降”和“总使用量爆发”可以同时爆发。。。。 。。

企业内部的情形也类似。。。。 。。已经大宗使用AI的公司会优化Token预算,,,, ,镌汰铺张;;还没完全上车的公司,,,, ,会由于模子更自制、更容易安排而最先使用。。。。 。。

智能体AI还会放大Token消耗。。。。 。。一个使命已往只需一次挪用,,,, ,现在可能被拆成多步执行、重复妄想、挪用工具、读取上下文,,,, ,单使命Token消耗会显着增添。。。。 。。素材中提到,,,, ,有中小企业案例显示,,,, ,营业agent化后,,,, ,每个使命的Token消耗酿成原来的3.5倍。。。。 。。

以是,,,, ,市场争论的要害不是“Token会不会继续增添”,,,, ,而是“增添的单位经济模子是否康健”。。。。 。。

当下,,,, ,企业已经最先管账单

企业端最先袒露的问题,,,, ,不是AI没人用,,,, ,而是用得太随意。。。。 。。

Axios援引一位AI照料的新闻称,,,, ,其一家企业客户近期单月在Claude上破费5亿美元,,,, ,原因只是没有对员工使用量设置上限。。。。 。。

在企业内部,,,, ,把AI使用量看成审核指标,,,, ,也最先爆发副作用。。。。 。。

此前美国部分公司内部把AI使用量当成排名或审核指标,,,, ,效果诱发了“Tokenmaxxing”:员工为了刷高使用量,,,, ,让AI执行低价值使命。。。。 。。

亚马逊旗下开发者平台Kiro曾设有内部排行榜“Kirorank”。。。。 。。亚马逊高级副总裁Dave Treadwell认可,,,, ,员工为了刷榜让AI做无意义使命,,,, ,推高运营本钱。。。。 。。他随后要求员工“不要为了用AI而用AI”,,,, ,相关测试版仪表盘被下线。。。。 。。

亚马逊后续改用“归一化安排”指标,,,, ,追踪AI天生代码的现实价值,,,, ,而不是纯粹追踪Token消耗。。。。 。。Meta内部也泛起过类似拉高Token消耗量以占有排名优势的情形。。。。 。。

这类调解的寄义很明确:企业不是停用AI,,,, ,而是最先区分“有用Token”和“无效Token”。。。。 。。

摩根大通提到,,,, ,Cloudflare推出AI Gateway这类产品,,,, ,目的就是资助企业控制Token预算。。。。 。。OpenRouter等工具也恒久保存,,,, ,实质都是在差别模子之间做路由和本钱治理。。。。 。。

定价端也在转变。。。。 。。

6月1日,,,, ,GitHub Copilot正式从按请求收费切换为按Token用量计费。。。。 。。Reddit社区有用户体现,,,, ,其月度用度预计将从不到45美元升至凌驾847美元。。。。 。。

GitHub首席产品官Mario Rodriguez此前称,,,, ,随着智能体AI兴起,,,, ,旧有定价模式已不可一连。。。。 。。

Gartner剖析师Arun Chandrasekaran在接受Business Insider采访时称,,,, ,随着高级推理模子推高算力消耗,,,, ,更多企业将转向按用量计费。。。。 。。

这意味着,,,, ,已往靠牢靠订阅或津贴隐藏的本钱,,,, ,正在被摆到企业财务外貌。。。。 。。

多空分歧:硬件生意的逻辑还建设吗??

这场争论的最终问题,,,, ,是AI基础设施的投资逻辑是否还建设。。。。 。。

多头的依据是:高盛的Jim Schneider测算,,,, ,到2030年,,,, ,署理式AI将推动Token消耗量增添24倍,,,, ,云服务商毛利率将在短期内转正。。。。 。。Mark Schilsky也以为,,,, ,Token支出的短期乱象不会改变恒久趋势。。。。 。。

空头的依据是:高盛半导体剖析师Jim Covello以为,,,, ,目今工业链昌盛是以牺牲上游消耗为价钱的,,,, ,险些所有价值都流向了半导体公司,,,, ,这种状态不可一连。。。。 。。投资人Tommy Shaughnessy忠言,,,, ,AI大厂利润率深度为负,,,, ,一旦企业直面按量计费的真实价钱,,,, ,支持GPU采购和模子训练的资源流动将面临逆转。。。。 。。

克日接受采访时,,,, ,Anthropic CEO Dario Amodei、博通总裁Hock Tan、《大空头》原型Steve Eisman等也都谈到类似问题:企业现在对AI工具保存太过支出,,,, ,也就是“Token最大化”征象;;随着本钱意识增强和计费模式转向按Token收费,,,, ,未来更需要看现实投资回报率。。。。 。。

社交媒体上,,,, ,也有声音直接质疑这张图的叙事框架。。。。 。。有用户指出,,,, ,"六天连跌去年在接纳岑岭期爆发过四次",,,, ,"更自制的模子反而会加速安排,,,, ,由于本钱门槛降低了"。。。。 。。

也有人反驳:"不管多自制,,,, ,每次新模子宣布都会指数级消耗更多Token。。。。 。。"

现在,,,, ,这场争论没有定论。。。。 。。但有一点是确定的:Token支出的边际转变,,,, ,通过GPU算力、DRAM内存及数据中心需求的传导链条,,,, ,直接影响英伟达、存储芯片厂商及云服务商的资源开支预期。。。。 。。这张图,,,, ,投资者不得不盯着看。。。。 。。

 

文章点评

未盘问到任何数据!

揭晓谈论

◎接待加入讨论,,,, ,请在这里揭晓您的看法、交流您的看法。。。。 。。

最新文章

热门文章

随机推荐

【网站地图】