新智元报道
【新智元导读】Claude账号忘设上限,,,,一月烧光近5亿美元!开发者每月破费从29美元变750美元,,,,尚有的从50美元一起狂飙到3000美元:你的Token账单还撑得住吗????
1个月烧出5亿美元账单!
克日,,,,科技圈曝出一桩惊天乌龙。。。。。。据Axios报道,,,,一家企业在短短1个月内,,,,竟然在Claude上刷爆5亿美元!
原因令人哭笑不得:治理层在给员工开通Claude账号权限时,,,,忘了设置使用额度上限。。。。。。
着实,,,,AI账单爆仓的远不止这一家。。。。。。
今年4月,,,,一名谷歌云用户因果真服务中遗留的API key被滥用,,,,原本只有7美元预算的账户,,,,一夜之间收到了1.8万美元的账单。。。。。。
这个倒运用户名叫Jesse Davies,,,,是一名澳大利亚AI照料、Agentic Labs首创人。。。。。。他给自己的Google Cloud账户设了两道包管:一个10澳元(约7美元)的预算预警,,,,一个1400美元的硬性消耗上限。。。。。。
据Tom's Hardware报道,,,,攻击者发明了他几个月前从AI Studio宣布的一个Cloud Run服务,,,,发了6万多个请求,,,,两道包管都没拦。。。。。。赫说ヅ趟阌醒映伲,,,等系统反映过来,,,,金额已经飙到了1.8万美元。。。。。。
5月中旬,,,,开源项目OpenClaw的首创人Peter Steinberger在X上贴出一张截图:30天,,,,OpenAI API账单130万美元。。。。。。
他的团队只有三个人,,,,但他们指挥的100个Codex智能体在并行跑:30天烧掉6030亿个Token、跑出760万次请求。。。。。;;;;;购茫,,,这130万美元并非他自掏腰包。。。。。。
Steinberger今年2月加入了OpenAI,,,,这130万美元被看成一次内部实验:测试若是不思量Token本钱,,,,AI编程能跑到什么极限。。。。。。他增补道,,,,这是Codex「Fast Mode」(高速档计费)的效果,,,,关掉之后约莫30万美元。。。。。。
更早一些,,,,Uber的CTO Praveen Neppalli Naga也曾向The Information认可,,,,公司4月份就把整年的Claude Code预算烧光了,,,,他们的COO也果真体现,,,,AI本钱越来越「难以自圆其说」。。。。。。
5亿、130万、1.8万,,,,金额虽然差出几个数目级,,,,却指向统一个事实:
在智能体时代,,,,失控的密钥、昼夜无休的智能体军团、忘了设上限的账号:任何一个,,,,都能让你的Token账简单夜刷爆。。。。。。
AI账单为什么会爆仓????
谜底主要藏在计费方式的转变里。。。。。。
从今年4月起,,,,OpenAI的包月计费方式最先转向按Token用量计费。。。。。。
4月2日,,,,Codex计费从按新闻估算改成按Token用量对齐:输入、缓存输入、输出三类Token脱离算。。。。。。4月23日,,,,这套规则扩展到所有Enterprise、Edu、Health、Gov方案:月费里那笔看不见的折扣被抽掉了。。。。。。
GitHub也紧随厥后,,,,刚刚官宣:所有Copilot套餐从2026年6月1日起,,,,转向按用量计费。。。。。。旧的高级请求逻辑作废,,,,换成AI额度,,,,按输入Token、输出Token、缓存Token的现实消耗,,,,比照每个模子的API费率结算。。。。。。
GitHub官方诠释了这么做的原因:
现在一个快速的谈天提问,,,,和一次跑好几小时的自主编码使命,,,,用户花的钱一样多。。。。。。GitHub一直在替那些跑重度使命的用户买单,,,,但这套模式已经不可一连。。。。。。
AI智能体崛起之前,,,,谈天和补全本钱差未几,,,,月费兜得住。。。。。。
智能体崛起之后,,,,一次使命能一连跑几小时、改动整个代码库,,,,重度用户和轻度用户的本钱差可以拉到几个数目级。。。。。。月费制在这种差别眼前,,,,直接崩了。。。。。。
新闻一出,,,,Reddit和X上一片哗然。。。。。。
一位ID为JBusu的开发者晒出了账单截图,,,,直言新定价「就是个笑话」。。。。。。原本28.12美元/月的开销,,,,按新制要付746.01美元,,,,他已决议退订,,,,「这个价钱,,,,我自己租云服务器都还自制」。。。。。。
另一名用户截图更夸张,,,,用度从50美元一起狂飙到3000美元,,,,他说没想到定价这样离谱,,,,「尚有人继续订阅吗????」
不过也有Copilot老用户出来反驳:这些极端账单大都是vibe-coder(凭感受编码者)们不把烧Token当回事给烧出来的,,,,未必能代表正常使用。。。。。。
一位老用户在谈论区留言:「我整天都在用,,,,月尾基本不逾额,,,,很难相信这是事情重漂后的差别。。。。。。」另一位则更直接:「就是有人要全自动的YOLO模式开发,,,,让AI随便跑。。。。。。这种铺张被剔除,,,,对其他人反而是好事。。。。。。」
有一点必需清晰:GitHub没有破除月费,,,,基础订阅价钱并没有变。。。。。。真正变的是特殊用量、智能体使命、更贵的模子挪用,,,,以后进入用量计费。。。。。。
被攻击最大的,,,,是那些靠Copilot跑长链使命的重度智能体用户。。。。。。
被自己人玩坏的排行榜
月费失守,,,,一面是平台改了计费规则,,,,另一面是用AI的人,,,,自己也在拼命烧。。。。。。
5月,,,,Business Insider报道,,,,Amazon下线了一个名叫KiroRank的内部AI使用排行榜。。。。。。
该报道援引知情人士的话称,,,,这个榜单悄悄催生了一种希奇的事情方式:部分员工为了在榜单上多爬几位,,,,会去刷一些并不解决现实问题的Token消耗,,,,纯粹为了排名。。。。。。
事情曝出之后,,,,Amazon高级副总裁Dave Treadwell直接向全员喊话:「别为了用AI而用AI。。。。。。用它去解决客户问题,,,,解决营业问题,,,,去立异。。。。。。」
这事虽然有点荒唐,,,,但绝不料外。。。。。。当「烧Token」能上榜,,,,员工自然就会去烧Token。。。。。。
硅谷给这种征象起了个专门的名字:Tokenmaxxing(极限烧Token),,,,把消耗量当生产力。。。。。。
Axios的报道里也提到,,,,有CTO发明员工拿AI模子查天气、写日常邮件,,,,简朴到不可的事,,,,套上最贵的前沿模子,,,,账单就能悄无声息地飞涨。。。。。。
KiroRank并非Amazon官方审核系统,,,,而是员工自觉搭的非正式工具。。。。。。但它清晰地袒露了一个经典的治理学纪律:当KPI设错的时间,,,,人就会用最智慧的方式钻空子。。。。。。
把「用了几多」等同于「干得好欠好」——这正是这一轮AI铺张的制度性泉源。。。。。。
算Token账的人,,,,已经在赚钱
Token账单焦虑的另一面,,,,有人悄悄把它做成了生意。。。。。。
第一条路:用上下文喂饱AI。。。。。。
Glean正是Arvind自家公司。。。。。。它做的就是企业AI事情助手:把疏散在公司各处的知识统一买通,,,,让员工的AI直接拿到上下文,,,,不必再四处翻箱倒柜。。。。。。AI少绕路,,,,烧的Token自然就少。。。。。。
这套机制让Glean的年度营收15个月翻三倍,,,,跨过3亿美元,,,,客户包括Databricks、Reddit、Samsung。。。。。。
第二条路:把活分给对的模子。。。。。。
模子路由首创公司Factory AI干的就是这件事:自动把每个使命派给最合适的模子,,,,简朴使命走自制档,,,,重大使命走顶配。。。。。。Arvind也讲过:路由做对了,,,,能省10倍。。。。。。
这两条路殊途同归:让AI干活,,,,但别让它乱烧。。。。。。
学术圈的研究,,,,也在为这种转向涤讪。。。。。。
https://arxiv.org/pdf/2604.22750
2026年4月的一篇arXiv论文,,,,第一次系统拆解了智能体编码使命究竟怎么烧钱。。。。。。
结论一:智能体使命的Token消耗,,,,可达通俗代码推理和代码对话的上千倍,,,,推高本钱的主因是输入Token。。。。。。
结论二:统一个使命跑多次,,,,Token消耗能差出30倍。。。。。。
结论三:更高的Token消耗,,,,并不必定带来更高准确率。。。。。。精度往往在中等本钱处见顶——再往上烧,,,,钱花了,,,,效果反而饱和。。。。。。
论文还发明,,,,前沿模子连展望自己要烧几多Token都做不到,,,,普遍低估真实本钱。。。。。。
你以为多花钱就能多服务。。。。。。现实是钱花了,,,,活纷歧定更好,,,,预算还算禁绝。。。。。。
当AI账单最先赶超人力本钱
「这是我影象中第一次,,,,手艺本钱最先和人力本钱持平。。。。。。」
5月29日,,,,Glean CEO Arvind Jain在接受CNBC记者Deirdre Bosa采访时这样讲道。。。。。。
英伟达应用深度学习副总裁Bryan Catanzaro的视察也印证了这一点。。。。。。
他在Axios访谈里提到:关于他的团队来说,,,,算力本钱已经远远凌驾员工薪资。。。。。。
类似的征象正在多家公司浮现:从做企业AI的Glean,,,,到卖AI算力的英伟达,,,,再到用AI的Uber,,,,都在重新审阅这笔账。。。。。。
在Arvind看来,,,,历史上手艺只是企业整体本钱里很小的一块,,,,但现在AI本钱已经能追平人为单了,,,,许多企业的年度AI预算通常都是一到两个月就烧光。。。。。。
已往一年,,,,AI使用率是被敬重的指标:多用就是先进,,,,烧Token就是拥抱未来。。。。。。现在,,,,许多企业最先反思那句质朴的话:这些烧掉的Token,,,,究竟换来了什么????
免费包月畅用的窗口期,,,,恰恰正在此时关上。。。。。。
接下来,,,,摆在所有开发者眼前的是这样一个问题:怎样精打细算,,,,让每一个Token施展出最大价值。。。。。。
未来真正的赢家,,,,毫无疑问将是最先学会算Token账的谁人。。。。。。
参考资料:
https://x.com/dee_bosa/status/2060791500049613306%20
https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20
https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20
https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5
编辑:元宇
“双方要拓展务实相助,,,,为两国人民带来更大福祉”“亲最近往相助,,,,携手推进中朝友好和两国社会主义事业”,,,,“相助”是习近平与金正恩晤谈交流的高频词。。。。。。