凯时AG

泉源:中方:坚决阻挡个体荷兰媒体涉台言论作者: 邓意婷:

Claude刷爆5亿!一夜涨60倍,,, ,,,你的Token账单还撑得。。。。。??

新智元报道

【新智元导读】Claude账号忘设上限,,, ,,,一月烧光近5亿美元!开发者每月破费从29美元变750美元,,, ,,,尚有的从50美元一起狂飙到3000美元:你的Token账单还撑得住吗??

1个月烧出5亿美元账单!

克日,,, ,,,科技圈曝出一桩惊天乌龙。。。。。。据Axios报道,,, ,,,一家企业在短短1个月内,,, ,,,竟然在Claude上刷爆5亿美元!

原因令人哭笑不得:治理层在给员工开通Claude账号权限时,,, ,,,忘了设置使用额度上限。。。。。。

着实,,, ,,,AI账单爆仓的远不止这一家。。。。。。

今年4月,,, ,,,一名谷歌云用户因果真服务中遗留的API key被滥用,,, ,,,原本只有7美元预算的账户,,, ,,,一夜之间收到了1.8万美元的账单。。。。。。

这个倒运用户名叫Jesse Davies,,, ,,,是一名澳大利亚AI照料、Agentic Labs首创人。。。。。。他给自己的Google Cloud账户设了两道包管:一个10澳元(约7美元)的预算预警,,, ,,,一个1400美元的硬性消耗上限。。。。。。

据Tom's Hardware报道,,, ,,,攻击者发明了他几个月前从AI Studio宣布的一个Cloud Run服务,,, ,,,发了6万多个请求,,, ,,,两道包管都没拦。。。。。。赫说ヅ趟阌醒映,,, ,,,等系统反映过来,,, ,,,金额已经飙到了1.8万美元。。。。。。

5月中旬,,, ,,,开源项目OpenClaw的首创人Peter Steinberger在X上贴出一张截图:30天,,, ,,,OpenAI API账单130万美元。。。。。。

他的团队只有三个人,,, ,,,但他们指挥的100个Codex智能体在并行跑:30天烧掉6030亿个Token、跑出760万次请求。。。。。;;;; ;购,,, ,,,这130万美元并非他自掏腰包。。。。。。

Steinberger今年2月加入了OpenAI,,, ,,,这130万美元被看成一次内部实验:测试若是不思量Token本钱,,, ,,,AI编程能跑到什么极限。。。。。。他增补道,,, ,,,这是Codex「Fast Mode」(高速档计费)的效果,,, ,,,关掉之后约莫30万美元。。。。。。

更早一些,,, ,,,Uber的CTO Praveen Neppalli Naga也曾向The Information认可,,, ,,,公司4月份就把整年的Claude Code预算烧光了,,, ,,,他们的COO也果真体现,,, ,,,AI本钱越来越「难以自圆其说」。。。。。。

5亿、130万、1.8万,,, ,,,金额虽然差出几个数目级,,, ,,,却指向统一个事实:

在智能体时代,,, ,,,失控的密钥、昼夜无休的智能体军团、忘了设上限的账号:任何一个,,, ,,,都能让你的Token账简单夜刷爆。。。。。。

AI账单为什么会爆仓??

谜底主要藏在计费方式的转变里。。。。。。

从今年4月起,,, ,,,OpenAI的包月计费方式最先转向按Token用量计费。。。。。。

4月2日,,, ,,,Codex计费从按新闻估算改成按Token用量对齐:输入、缓存输入、输出三类Token脱离算。。。。。。4月23日,,, ,,,这套规则扩展到所有Enterprise、Edu、Health、Gov方案:月费里那笔看不见的折扣被抽掉了。。。。。。

GitHub也紧随厥后,,, ,,,刚刚官宣:所有Copilot套餐从2026年6月1日起,,, ,,,转向按用量计费。。。。。。旧的高级请求逻辑作废,,, ,,,换成AI额度,,, ,,,按输入Token、输出Token、缓存Token的现实消耗,,, ,,,比照每个模子的API费率结算。。。。。。

GitHub官方诠释了这么做的原因:

现在一个快速的谈天提问,,, ,,,和一次跑好几小时的自主编码使命,,, ,,,用户花的钱一样多。。。。。。GitHub一直在替那些跑重度使命的用户买单,,, ,,,但这套模式已经不可一连。。。。。。

AI智能体崛起之前,,, ,,,谈天和补全本钱差未几,,, ,,,月费兜得住。。。。。。

智能体崛起之后,,, ,,,一次使命能一连跑几小时、改动整个代码库,,, ,,,重度用户和轻度用户的本钱差可以拉到几个数目级。。。。。。月费制在这种差别眼前,,, ,,,直接崩了。。。。。。

新闻一出,,, ,,,Reddit和X上一片哗然。。。。。。

一位ID为JBusu的开发者晒出了账单截图,,, ,,,直言新定价「就是个笑话」。。。。。。原本28.12美元/月的开销,,, ,,,按新制要付746.01美元,,, ,,,他已决议退订,,, ,,,「这个价钱,,, ,,,我自己租云服务器都还自制」。。。。。。

另一名用户截图更夸张,,, ,,,用度从50美元一起狂飙到3000美元,,, ,,,他说没想到定价这样离谱,,, ,,,「尚有人继续订阅吗??」

不过也有Copilot老用户出来反驳:这些极端账单大都是vibe-coder(凭感受编码者)们不把烧Token当回事给烧出来的,,, ,,,未必能代表正常使用。。。。。。

一位老用户在谈论区留言:「我整天都在用,,, ,,,月尾基本不逾额,,, ,,,很难相信这是事情重漂后的差别。。。。。。」另一位则更直接:「就是有人要全自动的YOLO模式开发,,, ,,,让AI随便跑。。。。。。这种铺张被剔除,,, ,,,对其他人反而是好事。。。。。。」

有一点必需清晰:GitHub没有破除月费,,, ,,,基础订阅价钱并没有变。。。。。。真正变的是特殊用量、智能体使命、更贵的模子挪用,,, ,,,以后进入用量计费。。。。。。

被攻击最大的,,, ,,,是那些靠Copilot跑长链使命的重度智能体用户。。。。。。

被自己人玩坏的排行榜

月费失守,,, ,,,一面是平台改了计费规则,,, ,,,另一面是用AI的人,,, ,,,自己也在拼命烧。。。。。。

5月,,, ,,,Business Insider报道,,, ,,,Amazon下线了一个名叫KiroRank的内部AI使用排行榜。。。。。。

该报道援引知情人士的话称,,, ,,,这个榜单悄悄催生了一种希奇的事情方式:部分员工为了在榜单上多爬几位,,, ,,,会去刷一些并不解决现实问题的Token消耗,,, ,,,纯粹为了排名。。。。。。

事情曝出之后,,, ,,,Amazon高级副总裁Dave Treadwell直接向全员喊话:「别为了用AI而用AI。。。。。。用它去解决客户问题,,, ,,,解决营业问题,,, ,,,去立异。。。。。。」

这事虽然有点荒唐,,, ,,,但绝不料外。。。。。。当「烧Token」能上榜,,, ,,,员工自然就会去烧Token。。。。。。

硅谷给这种征象起了个专门的名字:Tokenmaxxing(极限烧Token),,, ,,,把消耗量当生产力。。。。。。

Axios的报道里也提到,,, ,,,有CTO发明员工拿AI模子查天气、写日常邮件,,, ,,,简朴到不可的事,,, ,,,套上最贵的前沿模子,,, ,,,账单就能悄无声息地飞涨。。。。。。

KiroRank并非Amazon官方审核系统,,, ,,,而是员工自觉搭的非正式工具。。。。。。但它清晰地袒露了一个经典的治理学纪律:当KPI设错的时间,,, ,,,人就会用最智慧的方式钻空子。。。。。。

把「用了几多」等同于「干得好欠好」——这正是这一轮AI铺张的制度性泉源。。。。。。

算Token账的人,,, ,,,已经在赚钱

Token账单焦虑的另一面,,, ,,,有人悄悄把它做成了生意。。。。。。

第一条路:用上下文喂饱AI。。。。。。

Glean正是Arvind自家公司。。。。。。它做的就是企业AI事情助手:把疏散在公司各处的知识统一买通,,, ,,,让员工的AI直接拿到上下文,,, ,,,不必再四处翻箱倒柜。。。。。。AI少绕路,,, ,,,烧的Token自然就少。。。。。。

这套机制让Glean的年度营收15个月翻三倍,,, ,,,跨过3亿美元,,, ,,,客户包括Databricks、Reddit、Samsung。。。。。。

第二条路:把活分给对的模子。。。。。。

模子路由首创公司Factory AI干的就是这件事:自动把每个使命派给最合适的模子,,, ,,,简朴使命走自制档,,, ,,,重大使命走顶配。。。。。。Arvind也讲过:路由做对了,,, ,,,能省10倍。。。。。。

这两条路殊途同归:让AI干活,,, ,,,但别让它乱烧。。。。。。

学术圈的研究,,, ,,,也在为这种转向涤讪。。。。。。

https://arxiv.org/pdf/2604.22750

2026年4月的一篇arXiv论文,,, ,,,第一次系统拆解了智能体编码使命究竟怎么烧钱。。。。。。

结论一:智能体使命的Token消耗,,, ,,,可达通俗代码推理和代码对话的上千倍,,, ,,,推高本钱的主因是输入Token。。。。。。

结论二:统一个使命跑多次,,, ,,,Token消耗能差出30倍。。。。。。

结论三:更高的Token消耗,,, ,,,并不必定带来更高准确率。。。。。。精度往往在中等本钱处见顶——再往上烧,,, ,,,钱花了,,, ,,,效果反而饱和。。。。。。

论文还发明,,, ,,,前沿模子连展望自己要烧几多Token都做不到,,, ,,,普遍低估真实本钱。。。。。。

你以为多花钱就能多服务。。。。。。现实是钱花了,,, ,,,活纷歧定更好,,, ,,,预算还算禁绝。。。。。。

当AI账单最先赶超人力本钱

「这是我影象中第一次,,, ,,,手艺本钱最先和人力本钱持平。。。。。。」

5月29日,,, ,,,Glean CEO Arvind Jain在接受CNBC记者Deirdre Bosa采访时这样讲道。。。。。。

英伟达应用深度学习副总裁Bryan Catanzaro的视察也印证了这一点。。。。。。

他在Axios访谈里提到:关于他的团队来说,,, ,,,算力本钱已经远远凌驾员工薪资。。。。。。

类似的征象正在多家公司浮现:从做企业AI的Glean,,, ,,,到卖AI算力的英伟达,,, ,,,再到用AI的Uber,,, ,,,都在重新审阅这笔账。。。。。。

在Arvind看来,,, ,,,历史上手艺只是企业整体本钱里很小的一块,,, ,,,但现在AI本钱已经能追平人为单了,,, ,,,许多企业的年度AI预算通常都是一到两个月就烧光。。。。。。

已往一年,,, ,,,AI使用率是被敬重的指标:多用就是先进,,, ,,,烧Token就是拥抱未来。。。。。。现在,,, ,,,许多企业最先反思那句质朴的话:这些烧掉的Token,,, ,,,究竟换来了什么??

免费包月畅用的窗口期,,, ,,,恰恰正在此时关上。。。。。。

接下来,,, ,,,摆在所有开发者眼前的是这样一个问题:怎样精打细算,,, ,,,让每一个Token施展出最大价值。。。。。。

未来真正的赢家,,, ,,,毫无疑问将是最先学会算Token账的谁人。。。。。。

参考资料:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

编辑:元宇

@林承枝:摸军警jj,,, ,,,普京与抱过的中国男孩互赠瓷器
@杨雅雯:樊振东20分钟横扫敌手晋级欧冠决赛
@郭刚男:女子随手扔筷子揭穿扑面男子眼镜

热门排行

【网站地图】