henry 发自 凹非寺量子位 | 公众号 QbitAI
Token经济学,,,可能并不经济。。
(除了AAAAA显卡黄总)
最近,,,Axios爆出一个挺逆天的事儿:一家企业,,,一个月就烧掉了5亿美元的Claude账单,,,合人民币34亿元。。
原因嘛,,,就是老板给员工开通了Anthropic的企业授权之后,,,忘了设置用量上限,,,然后token就一直烧烧烧……
烧了一个月,,,34个小目的就这么水灵灵地出去了。。
咱先不说烧得值不值,,,若是按Anthropic现在约470亿美元的年化收入(ARR)盘算,,,相当于这一家公司,,,一个月就孝顺了Anthropic靠近八分之一的月收入
换句话说,,,Anthropic每赚8块钱,,,其中就有1块来自这家公司。。
更夸张的是,,,这家公司至今没有果真身份。。
但Axios在报道里提到,,,能够“无痛”吞下5亿美元AI账单的企业,,,全球着实也没几多家。。
很快,,,X上最先泛起种种推测,,,其中被点名最多的是亚马逊。。
巧的是,,,就在险些统一时间,,,《金融时报》披露,,,亚马逊已经作废内部AI使用排行榜,,,由于员工最先为了冲榜而疯狂刷Token,,,甚至执行大宗没有现实价值的使命。。
这一前一后两条新闻放在一起看,,,味道就有点纷歧样了。。
已往两年,,,企业最担心的是员工不必AI。。而现在,,,越来越多企业最先担心另一件事:
AI是不是用得太多了。。
美国大厂,,,最先算账了
这种转变,,,最近正在越来越频仍地泛起。。
微软就是一个典范例子。。
最近,,,微软宣布将在6月30日之前作废Experiences + Devices部分(认真Windows、Microsoft 365、Outlook、Teams、Surface)的大部分Claude Code授权,,,工程师们被要求迁徙到自家的GitHub Copilot CLI。。
而Claude Code进入微软内部,,,距离现在不过6个月。。
微软给出的理由很切合硅谷古板——
Claude Code已经完成了资助团队学习和探索的阶段,,,是时间回到“Eat Your Own Dog Food”,,,使用自己的产品了。。
但无论怎样,,,Token账单都是绕不开的话题。。
类似的转变,,,也泛起在DeepSeek身上。。
今年4月宣布V4时,,,DeepSeek在手艺报告里提到,,,V4已经成为公司内部员工日常使用的Agentic Coding模子,,,体验优于Claude Sonnet 4.5,,,交付质量靠近Opus 4.6。。
虽然官方没有明确提及本钱因素,,,但关于拥有自研模子的公司来说,,,用自己的模子完成同样的事情,,,显然是一个更经济的选择。。
若是说微软和DeepSeek还算委婉客套,,,那么Uber则说得越发直接。。
Uber CTO Praveen Neppalli Naga今年早些时间透露,,,公司工程师仅用4个月就烧完了整年Claude Code预算。。
随后,,,Uber首席运营官Andrew Macdonald果真体现:AI Token消耗与最终宣布的有价值产品之间,,,似乎并不保存显着的线性关系。。
换句话说,,,花掉更多Token,,,并纷歧定意味着创立出更多价值。。
类似的反思,,,也最先泛起在更多公司内部。。
此前,,,多邻国曾妄想将AI使用情形纳入员工绩效审核。。但在员工质疑“是否必需为了使用AI而使用AI”之后,,,公司最终撤回了这一决议。。
“感受我们不是在为现实效果认真,,,而是在试图强推一些并不总是适合的工具。。”
今年4月的一档播客中,,,多邻国CEO路易斯·冯·安云云总结。。
Meta的转变则更具代表性。。
在被曝出内部建设Claude使用排行榜、单月消耗数十亿Token后,,,Meta也逐渐最先收紧相关激励,,,从勉励“多用、多刷”,,,转向更关注现实产出。。
与此同时,,,海内也泛起了类似声音。。
米哈游郑银河曾分享过一次履历:某个Agent项目上线后,,,一晚上烧掉了200万元Token用度。。
这笔学费不算自制。。但它也让越来越多企业意识到一个问题:Token自己并不是价值,,,完成使命、交付产品、创立收入,,,才是价值。。
可以说,,,企业依然相信AI,,,只是相比去年,,,它们最先不再纯粹追求消耗更多Token,,,而是最先认真盘算每一个Token背后的ROI。。
AI第一次酿成了财务问题
毫无疑问,,,在履历了泰半年的“黄氏Token经济学”之后,,,美国大厂最先认真反思:
这些Token,,,究竟花得值不值????
今年3月,,,黄仁勋在《All-In Podcast》中曾为这套逻辑果真背书。。
若是一个年薪50万美元的工程师每年消耗的token不到25万美元,,,他会深感担心。。
在其时,,,这句话被许多企业奉为圭臬。。
事实,,,若是AI真的能提升工程师效率,,,那么多烧一些Token,,,实质上是在购置生产力。。
用的越多,,,省得越多就是这么来的。。
但问题在于:当一张张真实账单最先寄到企业手里时,,,事情最先变得没那么简朴。。
无论是Amazon作废排行榜,,,微软缩短Claude Code授权,,,照旧Uber发明工程师4个月烧光整年预算。。
老板们最终照旧选择了用脚投票。。
最近,,,关于这件事的讨论也最先在Hacker News上发酵。。
有人以为,,,这是一个主要转折点。。
已往那种把Token消耗量等同于AI接纳率、甚至等同于生产力的狂热阶段,,,正在竣事。。
也有人把矛头直接指向了已往半年盛行的“Tokenmaxxing”文化。。
(注:Token是大语言模子处理文本的基本单位,,,也是计费单位。。Tokenmaxxing指的是企业和员工疯狂追求token消耗量,,,把“烧了几多token”当成AI接纳率和生产力的权衡指标。。)
在他们看来,,,问题并不在于AI,,,而在于企业把“烧更多Token”误当成了目的自己。。
若是使用更高效的模子、合理控制Agent事情流,,,或者让人类加入要害决议,,,本钱本可以低得多。。
虽然,,,也有人开玩笑说:
这场运动最大的赢家,,,重新到尾可能只有黄仁勋。。
不过,,,另一种看法同样值得关注。。
不少开发者以为,,,这并不是AI热潮退去的信号。。
恰恰相反。。
这意味着企业终于最先从“先用再说”,,,进入“细腻运营”的阶段。。
未来各人关注的重点,,,可能不再是谁烧掉更多Token,,,而是谁能用更少的Token完成更多使命。。
好比:更高效的Agent事情流;;;;;廉价模子处理简朴使命;;;;;腾贵模子只认真要害决议;;;;;更严酷的预算和权限治理。。
[1]https://www.tomshardware.com/tech-industry/artificial-intelligence/mystery-company-accidentally-blew-usd500-million-on-claude-in-a-single-month-failed-to-put-usage-limit-on-licenses-for-employees
[2]https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs
[3]https://news.ycombinator.com/item?id=48307098
在办案审查官的建议下,,,侦查职员将肖某手机送至判断机构恢复数据。。几天后,,,肖某手机微信谈天纪录被乐成恢复,,,明确证实王某即“老王”,,,谈天内容还还原了4人组队盗墓的全历程。。经比照阜阳站下车职员名单、组织在案职员识别,,,最终,,,加入前期盗墓的王某、“师兄”阚某、汪某、宗某等4人浮出水面。。审查机关随即向公安机关发出增补移送起诉通知书。。