亚马逊叫停AI用量排行榜,,把烧Token当绩效审核可行吗
亚马逊下线了一个追踪内部使用AI(人工智能)的排行榜,,原因是员工刻意刷量,,推高了公司算力本钱。。
据《金融时报》5月29日报道,,亚马逊在本周通知员工,,旗下“Kirorank”榜单已阻止服务。。这一榜单依托亚马逊内部开发者平台Kiro,,原本用于给用户的AI活动量打分,,设立初志是为推动AI在营业场景的应用,,效果事与愿违。。一些员工为追求排名,,安排AI智能体执行无意义的操作,,追求Token使用量最大化,,造成公司算力资源太过消耗。。
不止亚马逊一家,,Meta、微软、谷歌等硅谷巨头也泛起内部比拼Tokenmaxxing(Token最大化)的情形。。这股民俗还从硅谷伸张至中国,,有网友发帖称海内个体大厂最先审核Token消耗量,,将此与转正、年度绩效、提升挂钩。。
当烧Token成为KPI,,企业怎样阻止内部陷入“为用AI而用”、盲目刷量冲榜进而引发算力空耗的怪圈??????更深层的问题是,,Token消耗量高能否同于产出价值高??????相比烧了几多Token,,有无更成熟、稳固且可行的AI价值权衡标准??????
硅谷“卷”Token用量
所谓Token是大模子处理文本的最小单位,,每一次提醒词输入和模子输出都会消耗Token——1个Token既可以是一个单字,,也可以是一个常见的词语,,或者一个标点符号、空格。。在海内,,国家数据局于今年3月将Token译为“词元”,,以为这不但是智能时代的价值锚点,,更是毗连手艺供应与商业需求的“结算单位”。。
随着AI应用的加速推进,,Token的消耗正被越来越多厂商视为反映Al的生长规模和活跃水平的指标。。在硅谷,,迩来兴起了一股名为Tokenmaxxing(Token 最大化)的风潮——包括亚马逊、Meta、微软等科技巨头为勉励员工起劲使用AI工具,,将此纳入审核指标,,有的公司甚至设置内部排行榜,,通过数据看板实时展示员工Token消耗数据。。
以Meta为例,,今年4月初,,一名Meta员工开发了名为 “Claudeonomics” 的内部仪表盘,,用来统计公司超8.5万员工的Token使用量,,并展示了前250名的名字。。据媒体报道,,30天内,,Meta全员“烧掉”了60万亿Token,,排名第一的员工平均消耗2810亿Token——按Claude果真的API价钱折算,,“榜一年迈”单月消耗了公司凌驾 140万美元的AI用度。。不过这份榜单,,被一家科技媒体曝光后已经下线,,建设者体现“因数据被外部分享,,决议暂时关闭。。”
不止科技公司,,流媒体巨头迪士尼也加入Tokenmaxxing行列,,在内网上线了一块名为“AI Adoption Dashboard”的看板,,实时展示员工挪用美国人工智能公司Anthropic旗下Claude模子的频率、请求次数、Token消耗量。。
这些行为批注,,一些公司治理层正在将Token消耗量纳入审核系统,,用以权衡员工的AI能力。。今年3月,,英伟达CEO黄仁勋在GTC大会直言,,若是一位年薪50万美元的工程师,,一年消耗不掉25万美元的Token,,他会深感焦虑。;;;;迫恃购俺鲆裈oken当人为发,,每年给工程师一笔相当于一半薪水的Token预算,,“让他们的能力放大10倍”。。
在以黄仁勋为代表的AI大佬的叙事框架里,,Token正成为一种生产力指标,,未来还可能酿成薪酬福利、新钱币。。不过,,这样的行业叙事也面临质疑,,其中一个现实问题是,,Token消耗涉及本钱问题,,大宗的AI投入最终有几多转化成了有用的产出??????当Token用量与审核绑定,,这将激励员工进一步拥抱AI浪潮,,照旧可能被异化??????
亚马逊的实践案例,,给出了一种谜底。。5月29日,,据《金融时报》报道,,亚马逊近期关停了内部AI使用排行榜KiroRank。。这一系统最初用于评估开发者平台 Kiro 的用户AI使用体现,,但部分员工使用AI智能体执行大宗无效使命“刷榜”,,致使亚马逊的算力本钱大幅攀升。。
此前,,亚马逊被曝设定审核目的,,要求超80%的研发职员每周必需使用AI工具,,并通过内部排行榜实时统计Token消耗量。。为应对审核压力,,不少员工泛起了刷数据的行为。。
据亚马逊先容,,这份榜单由部分员工自觉搭建,,初志是让各人看到AI的赋能作用,,公司的焦点目的是提升运营效率,,但效果适得其反。。亚马逊高级副总裁戴夫·特雷德韦尔(Dave Treadwell)申饬员工,,“请不要为了用AI而用AI。。”
另据媒体报道,,亚马逊已最先改用“标准化安排量”作为新审核指标,,更关注工程师用AI产出有用代码的频率,,而非纯粹的Token消耗量。。
当Token成为KPI,,有人用腾贵的算力演出忙碌
除了亚马逊外,,Meta等科技公司员工也被曝保存刻意刷Token消耗量、抬高内部排名的问题。。怎样看待员工的Tokenmaxxing行为??????
艾媒咨询CEO张毅告诉南都记者,,硅谷企业推出Token消耗榜单,,焦点是借助可量化数据快速推动AI工具普及,,用排名竞争倒逼员工自动拥抱AI,,加速企业数字化转型。。但在排名压力下,,员工必定会举行无效挪用,,这不但铺张算力资源,,还会疏散事情精神,,违反AI降本增效的初志,,也反映出企业AI治理系统保存短板。。
大厂员工用腾贵的算力演出忙碌,,问题事实出在那里??????张毅直言,,泉源在于企业用简朴的Token使用频次替价钱值审核,,这种简单量化指标容易引发形式主义问题。。
南都记者注重到,,这股民俗也最先伸张至中国海内。。近期,,有网友发帖称某大厂绩效将参考Token消耗数据,,或影响转正、年度绩效、提升。。与此同时,,为了勉励员工拥抱AI厘革,,腾讯、阿里、字节等企业相继宣布了与Token有关的政策,,包括提供内部AI工具的免费额度、外部购置AI工具可报销,,为手艺和算法等焦点岗位设置Token津贴等,,也有企业以优异案例评优、立异项目奖励等方式勉励员工使用AI。。
当烧Token成为KPI,,怎样阻止陷入“为用AI而用AI”的怪圈??????张毅体现,,Token消耗量仅直观反映AI挪用频次与使用活跃度,,只能说明员工对AI工具的使用水平,,无法直接等同于事情效率与营业价值。。更合理的权衡指标应聚焦营业效果,,好比使命交付效率、内容可用率、过失返工率、本钱节约额、营业立异效果等,,从投入产出角度评估AI使用的真实效能。。
值得一提的是,,随着算力账单的增添,,一些科技公司最先审阅Token能否烧出价值。。好比,,Uber首席运营官麦克唐纳德(Andrew Macdonald)在近期的一档播客中体现,,更高的Token使用量并没有转化为一律、有用的功效增添,,公司越来越难以为一连攀升的AI支出做出合明确释。。
业内也不乏质疑“唯Token论”的声音。。今年3月,,Gartner研究副总裁孙鑫曾撰文指出,,Token数目在结构上并不适用于评估AI乐成与否,,反而可能误导企业机构的决议者,,主要有三点原因:以Token为信号会导致错位激励;;;;Token消耗与营业价值脱节;;;;Token数目在手艺上无法实现厂商之间的直接较量。。
百度首创人李彦宏也在思索,,AI时代的怀抱衡究竟是什么??????他以为,,Token只是代表本钱,,并不代表收益;;;;它权衡的是投入,,而不是产出。。另外,,Token消耗有没有用率、产出了什么价值——这些Token自己无法回覆。。
5月13日,,李彦宏在Create2026百度AI开发者大会正式提出,,进入智能体时代,,权衡一个平台和生态的昌盛,,比起Token消耗,,更应该关注“日活智能体数”(Daily Active Agents,,简称DAA),,关注有几多Agent在给人类干活,,并交付效果。。
此前,,美国CRM(客户关系治理)巨头Salesforce实验提出一个新看法:智能体事情单位(AWU, Agentic Work Units),,即智能体完成的一项自力使命,,它代表原始算力真正转化为现实事情价值的历程——既可以是完成一次指令交互,,也可以是走完一轮逻辑推理,,更焦点的是完成一次工具挪用。。
自智能体兴起以来,,行业以Token消耗量评判AI使用效果,,但Token只能体现于AI的交互频次,,无法权衡着实际落地的事情效果。。当企业试图将Token用量纳入KPI,,有须要思索怎么阻止这样审核机制跑偏。。未来Token狂热会退散,,怎样剔除无效的AI账单,,回归价值创立自己,,也是摆在企业眼前的必答题。。
采写:南都N视频记者李玲 发自北京
@金国华:9393体育app官方,,考生发明走错科场 铁骑“零秒响应”@陈琳发:上海蚊子太多可电话投诉
@杜晓雨:博主:这轮AI暴富潮太吓人