华尔街激辩“Token经济学”:AI账单失控了吗??
一张Token指数图,,,,,点燃了AI增添和账单失控的焦虑。。。。。。
这张图是Silicon Data统计的LLM Token支出指数。。。。。。6月11日,,,,,它已连跌7天,,,,,创下今年1月以来最长连跌纪录;;已往12天里,,,,,有11天是下跌的。。。。。。
这个指数权衡的是全市场每使用100万枚Token平均支付几多钱——可以明确为市场愿意为AI“付几多钱”的晴雨表。。。。。。它自去年12月以来翻了一番以上,,,,,并在2026年5月前一连攀升,,,,,但近期急转直下。。。。。。
它触动的不是一个小指标,,,,,而是整条AI生意链:若是企业最先控制Token账单,,,,,GPU、DRAM、数据中心和云厂商的资源开支预期,,,,,会不会被重新定价??
美国宏观战略师Andreas Steno Larsen在6月9日直接把这张图称为“目今全市场最应关注的一张图”,,,,,并忠言:若是Token定价一连走弱,,,,,本轮周期中从内存到更普遍的硬件及数据中心生意可能宣告竣事。。。。。。
这句话戳到了投资者最敏感的神经。。。。。。但华尔街的看法更为重大和多面,,,,,Token定价走弱可能并非纯粹的AI需求见顶。。。。。。
指数下跌是不是需求见顶??这张图究竟表达了什么
这张图不可简朴读成“AI没人用了”。。。。。。
它不是Token总需求指数,,,,,也不是Token总支出金额。。。。。。它量的是每百万Token的加权平均价钱——也就是说,,,,,它反映的是用户在用什么价位的模子。。。。。。
算一笔简朴的账就清晰了:假设前沿模子10美元/百万Token,,,,,自制模子1美元。。。。。。某个月100单位用量全跑在前沿模子上,,,,,指数是10。。。。。。下个月需求翻倍到200,,,,,但新增的全是自制模子跑的批量使命,,,,,指数直接掉到5.5。。。。。。
需求翻倍,,,,,指数腰斩。。。。。。
这意味着,,,,,指数下跌有两种完全差别的诠释:一是需求真的在萎缩;;二是用量在爆炸,,,,,但用户在自动向低价模子迁徙。。。。。。
这正是目今争论的焦点:指数下跌,,,,,究竟是需求见顶,,,,,照旧用量结构下沉??
Citadel证券宣布《Tokenomics》报告以为,,,,,AI落地的焦点约束已从"模子能力"转向"本钱与算力稀缺",,,,,用户正加速向廉价模子迁徙。。。。。。
“接纳趋势越来越不取决于前沿模子的功效,,,,,而更多取决于价钱……Token指数的近期下跌可能反映了这种向更自制模子转变的部分迹象。。。。。。”
摩根大通TMT剖析师Mark Schilsky则在6月11日把近期市场讨论概括为:“AI账单失控了。。。。。。”同时,,,,,该行以为目今的Token支出乱象只是“通往更高支出的最小减速带”。。。。。。
Citadel的判断:AI的“性价比与稀缺性”变得更主要了
Citadel证券在其最新宣布的《Tokenomics》报告中,,,,,给出了一个明确的偏向性判断。。。。。。
焦点论点是:AI落地的焦点约束,,,,,已经从"模子能力"转向了"本钱与稀缺性"。。。。。。
Citadel的表述是:“手艺落地的焦点不再是前沿模子理论上能做什么,,,,,而是规;;迪諥I运行所需的投入品的价钱与稀缺性。。。。。。算力、电力、冷却、内存带宽和推理预算,,,,,都是真实保存且具有约束力的限制条件。。。。。。”
报告援引经济学基来源理:价钱有三大功效——转达稀缺信号、催生替换动力、将资源设置到价值最高的用途。。。。。。这三条在AI领域正在同时爆发。。。。。。
结论是:未来最好的回报,,,,,不会来自那些构建最强模子的公司,,,,,而是来自那些降低AI本钱、提升效率的公司。。。。。。
同时,,,,,推理麋集型前沿AI不会消逝,,,,,但会越来越集中在少数有能力肩负本钱的大型企业手中。。。。。。对整个经济体而言,,,,,在物理约束缓解之前,,,,,更简朴的模子可能是更具生产力的路径。。。。。。
低价模子正在改变账单结构
高盛One-Delta部分认真人Rich Privorotsky曾提到,,,,,DeepSeek下调75%的定价,,,,,小米MiMo靠近99%的降价幅度,,,,,基础设施瓶颈缓解正在触发价钱战。。。。。。
Coinbase首席执行官Brian Armstrong展望,,,,,未来12至18个月,,,,,80%的AI事情负载会迁徙到本钱低99%的模子上,,,,,只有20%需要极致智能的使命会继续留在前沿模子上。。。。。。
Hugging Face首席执行官Clement Delangue援引斯坦福大学数据称,,,,,外地模子在真实天下盘问中的准确率已升至71.3%,,,,,且本钱极低。。。。。。
这与Citadel的判断相靠近:前沿AI不会消逝,,,,,但可能集中在少数能遭受算力本钱、具备研究深度、且能把高难度问题转化为规;;找娴钠笠凳种。。。。。。
对更普遍的经济体而言,,,,,在物理约束缓解前,,,,,更简朴的模子可能是更自制的生产力工具。。。。。。
也就是说,,,,,AI使用可能走向分层。。。。。。
高价值、重大使命继续使用前沿模子。。。。。。日常使命、批量使命、低回报实验,,,,,则转向自制模子或外地模子。。。。。。
摩根大通:优化账单,,,,,不即是AI需求见顶
摩根大通的判断则是:现在的账单焦虑,,,,,可能只是AI需求早期阶段的小减速带;;一年后Token支出可能显着更高。。。。。。
若是每百万Token平均本钱下降,,,,,但美国公司AI付费渗透率仍在上升,,,,,总Token用量在算术上就必需大幅增添。。。。。。也就是说,,,,,“单位价钱下降”和“总使用量爆发”可以同时爆发。。。。。。
企业内部的情形也类似。。。。。。已经大宗使用AI的公司会优化Token预算,,,,,镌汰铺张;;还没完全上车的公司,,,,,会由于模子更自制、更容易安排而最先使用。。。。。。
智能体AI还会放大Token消耗。。。。。。一个使命已往只需一次挪用,,,,,现在可能被拆成多步执行、重复妄想、挪用工具、读取上下文,,,,,单使命Token消耗会显着增添。。。。。。素材中提到,,,,,有中小企业案例显示,,,,,营业agent化后,,,,,每个使命的Token消耗酿成原来的3.5倍。。。。。。
以是,,,,,市场争论的要害不是“Token会不会继续增添”,,,,,而是“增添的单位经济模子是否康健”。。。。。。
当下,,,,,企业已经最先管账单
企业端最先袒露的问题,,,,,不是AI没人用,,,,,而是用得太随意。。。。。。
Axios援引一位AI照料的新闻称,,,,,其一家企业客户近期单月在Claude上破费5亿美元,,,,,原因只是没有对员工使用量设置上限。。。。。。
在企业内部,,,,,把AI使用量看成审核指标,,,,,也最先爆发副作用。。。。。。
此前美国部分公司内部把AI使用量当成排名或审核指标,,,,,效果诱发了“Tokenmaxxing”:员工为了刷高使用量,,,,,让AI执行低价值使命。。。。。。
亚马逊旗下开发者平台Kiro曾设有内部排行榜“Kirorank”。。。。。。亚马逊高级副总裁Dave Treadwell认可,,,,,员工为了刷榜让AI做无意义使命,,,,,推高运营本钱。。。。。。他随后要求员工“不要为了用AI而用AI”,,,,,相关测试版仪表盘被下线。。。。。。
亚马逊后续改用“归一化安排”指标,,,,,追踪AI天生代码的现实价值,,,,,而不是纯粹追踪Token消耗。。。。。。Meta内部也泛起过类似拉高Token消耗量以占有排名优势的情形。。。。。。
这类调解的寄义很明确:企业不是停用AI,,,,,而是最先区分“有用Token”和“无效Token”。。。。。。
摩根大通提到,,,,,Cloudflare推出AI Gateway这类产品,,,,,目的就是资助企业控制Token预算。。。。。。OpenRouter等工具也恒久保存,,,,,实质都是在差别模子之间做路由和本钱治理。。。。。。
定价端也在转变。。。。。。
6月1日,,,,,GitHub Copilot正式从按请求收费切换为按Token用量计费。。。。。。Reddit社区有用户体现,,,,,其月度用度预计将从不到45美元升至凌驾847美元。。。。。。
GitHub首席产品官Mario Rodriguez此前称,,,,,随着智能体AI兴起,,,,,旧有定价模式已不可一连。。。。。。
Gartner剖析师Arun Chandrasekaran在接受Business Insider采访时称,,,,,随着高级推理模子推高算力消耗,,,,,更多企业将转向按用量计费。。。。。。
这意味着,,,,,已往靠牢靠订阅或津贴隐藏的本钱,,,,,正在被摆到企业财务外貌。。。。。。
多空分歧:硬件生意的逻辑还建设吗??
这场争论的最终问题,,,,,是AI基础设施的投资逻辑是否还建设。。。。。。
多头的依据是:高盛的Jim Schneider测算,,,,,到2030年,,,,,署理式AI将推动Token消耗量增添24倍,,,,,云服务商毛利率将在短期内转正。。。。。。Mark Schilsky也以为,,,,,Token支出的短期乱象不会改变恒久趋势。。。。。。
空头的依据是:高盛半导体剖析师Jim Covello以为,,,,,目今工业链昌盛是以牺牲上游消耗为价钱的,,,,,险些所有价值都流向了半导体公司,,,,,这种状态不可一连。。。。。。投资人Tommy Shaughnessy忠言,,,,,AI大厂利润率深度为负,,,,,一旦企业直面按量计费的真实价钱,,,,,支持GPU采购和模子训练的资源流动将面临逆转。。。。。。
克日接受采访时,,,,,Anthropic CEO Dario Amodei、博通总裁Hock Tan、《大空头》原型Steve Eisman等也都谈到类似问题:企业现在对AI工具保存太过支出,,,,,也就是“Token最大化”征象;;随着本钱意识增强和计费模式转向按Token收费,,,,,未来更需要看现实投资回报率。。。。。。
社交媒体上,,,,,也有声音直接质疑这张图的叙事框架。。。。。。有用户指出,,,,,"六天连跌去年在接纳岑岭期爆发过四次",,,,,"更自制的模子反而会加速安排,,,,,由于本钱门槛降低了"。。。。。。
也有人反驳:"不管多自制,,,,,每次新模子宣布都会指数级消耗更多Token。。。。。。"
现在,,,,,这场争论没有定论。。。。。。但有一点是确定的:Token支出的边际转变,,,,,通过GPU算力、DRAM内存及数据中心需求的传导链条,,,,,直接影响英伟达、存储芯片厂商及云服务商的资源开支预期。。。。。。这张图,,,,,投资者不得不盯着看。。。。。。
文章点评
未盘问到任何数据!
揭晓谈论
◎接待加入讨论,,,,,请在这里揭晓您的看法、交流您的看法。。。。。。