凯时AG

泉源:广东暴雨天蟑螂成群出行动者: 黄伟贞:

亚马逊叫停AI用量排行榜,,,把烧Token当绩效审核可行吗

亚马逊下线了一个追踪内部使用AI(人工智能)的排行榜,,,原因是员工刻意刷量,,,推高了公司算力本钱。。

据《金融时报》5月29日报道,,,亚马逊在本周通知员工,,,旗下“Kirorank”榜单已阻止服务。。这一榜单依托亚马逊内部开发者平台Kiro,,,原本用于给用户的AI活动量打分,,,设立初志是为推动AI在营业场景的应用,,,效果事与愿违。。一些员工为追求排名,,,安排AI智能体执行无意义的操作,,,追求Token使用量最大化,,,造成公司算力资源太过消耗。。

不止亚马逊一家,,,Meta、微软、谷歌等硅谷巨头也泛起内部比拼Tokenmaxxing(Token最大化)的情形。。这股民俗还从硅谷伸张至中国,,,有网友发帖称海内个体大厂最先审核Token消耗量,,,将此与转正、年度绩效、提升挂钩。。

当烧Token成为KPI,,,企业怎样阻止内部陷入“为用AI而用”、盲目刷量冲榜进而引发算力空耗的怪圈?? ?? ?更深层的问题是,,,Token消耗量高能否同于产出价值高?? ?? ?相比烧了几多Token,,,有无更成熟、稳固且可行的AI价值权衡标准?? ?? ?

硅谷“卷”Token用量

所谓Token是大模子处理文本的最小单位,,,每一次提醒词输入和模子输出都会消耗Token——1个Token既可以是一个单字,,,也可以是一个常见的词语,,,或者一个标点符号、空格。。在海内,,,国家数据局于今年3月将Token译为“词元”,,,以为这不但是智能时代的价值锚点,,,更是毗连手艺供应与商业需求的“结算单位”。。

随着AI应用的加速推进,,,Token的消耗正被越来越多厂商视为反映Al的生长规模和活跃水平的指标。。在硅谷,,,迩来兴起了一股名为Tokenmaxxing(Token 最大化)的风潮——包括亚马逊、Meta、微软等科技巨头为勉励员工起劲使用AI工具,,,将此纳入审核指标,,,有的公司甚至设置内部排行榜,,,通过数据看板实时展示员工Token消耗数据。。

以Meta为例,,,今年4月初,,,一名Meta员工开发了名为 “Claudeonomics” 的内部仪表盘,,,用来统计公司超8.5万员工的Token使用量,,,并展示了前250名的名字。。据媒体报道,,,30天内,,,Meta全员“烧掉”了60万亿Token,,,排名第一的员工平均消耗2810亿Token——按Claude果真的API价钱折算,,,“榜一年迈”单月消耗了公司凌驾 140万美元的AI用度。。不过这份榜单,,,被一家科技媒体曝光后已经下线,,,建设者体现“因数据被外部分享,,,决议暂时关闭。。”

不止科技公司,,,流媒体巨头迪士尼也加入Tokenmaxxing行列,,,在内网上线了一块名为“AI Adoption Dashboard”的看板,,,实时展示员工挪用美国人工智能公司Anthropic旗下Claude模子的频率、请求次数、Token消耗量。。

这些行为批注,,,一些公司治理层正在将Token消耗量纳入审核系统,,,用以权衡员工的AI能力。。今年3月,,,英伟达CEO黄仁勋在GTC大会直言,,,若是一位年薪50万美元的工程师,,,一年消耗不掉25万美元的Token,,,他会深感焦虑。; ;迫恃购俺鲆裈oken当人为发,,,每年给工程师一笔相当于一半薪水的Token预算,,,“让他们的能力放大10倍”。。

在以黄仁勋为代表的AI大佬的叙事框架里,,,Token正成为一种生产力指标,,,未来还可能酿成薪酬福利、新钱币。。不过,,,这样的行业叙事也面临质疑,,,其中一个现实问题是,,,Token消耗涉及本钱问题,,,大宗的AI投入最终有几多转化成了有用的产出?? ?? ?当Token用量与审核绑定,,,这将激励员工进一步拥抱AI浪潮,,,照旧可能被异化?? ?? ?

亚马逊的实践案例,,,给出了一种谜底。。5月29日,,,据《金融时报》报道,,,亚马逊近期关停了内部AI使用排行榜KiroRank。。这一系统最初用于评估开发者平台 Kiro 的用户AI使用体现,,,但部分员工使用AI智能体执行大宗无效使命“刷榜”,,,致使亚马逊的算力本钱大幅攀升。。

此前,,,亚马逊被曝设定审核目的,,,要求超80%的研发职员每周必需使用AI工具,,,并通过内部排行榜实时统计Token消耗量。。为应对审核压力,,,不少员工泛起了刷数据的行为。。

据亚马逊先容,,,这份榜单由部分员工自觉搭建,,,初志是让各人看到AI的赋能作用,,,公司的焦点目的是提升运营效率,,,但效果适得其反。。亚马逊高级副总裁戴夫·特雷德韦尔(Dave Treadwell)申饬员工,,,“请不要为了用AI而用AI。。”

另据媒体报道,,,亚马逊已最先改用“标准化安排量”作为新审核指标,,,更关注工程师用AI产出有用代码的频率,,,而非纯粹的Token消耗量。。

当Token成为KPI,,,有人用腾贵的算力演出忙碌

除了亚马逊外,,,Meta等科技公司员工也被曝保存刻意刷Token消耗量、抬高内部排名的问题。。怎样看待员工的Tokenmaxxing行为?? ?? ?

艾媒咨询CEO张毅告诉南都记者,,,硅谷企业推出Token消耗榜单,,,焦点是借助可量化数据快速推动AI工具普及,,,用排名竞争倒逼员工自动拥抱AI,,,加速企业数字化转型。。但在排名压力下,,,员工必定会举行无效挪用,,,这不但铺张算力资源,,,还会疏散事情精神,,,违反AI降本增效的初志,,,也反映出企业AI治理系统保存短板。。

大厂员工用腾贵的算力演出忙碌,,,问题事实出在那里?? ?? ?张毅直言,,,泉源在于企业用简朴的Token使用频次替价钱值审核,,,这种简单量化指标容易引发形式主义问题。。

南都记者注重到,,,这股民俗也最先伸张至中国海内。。近期,,,有网友发帖称某大厂绩效将参考Token消耗数据,,,或影响转正、年度绩效、提升。。与此同时,,,为了勉励员工拥抱AI厘革,,,腾讯、阿里、字节等企业相继宣布了与Token有关的政策,,,包括提供内部AI工具的免费额度、外部购置AI工具可报销,,,为手艺和算法等焦点岗位设置Token津贴等,,,也有企业以优异案例评优、立异项目奖励等方式勉励员工使用AI。。

当烧Token成为KPI,,,怎样阻止陷入“为用AI而用AI”的怪圈?? ?? ?张毅体现,,,Token消耗量仅直观反映AI挪用频次与使用活跃度,,,只能说明员工对AI工具的使用水平,,,无法直接等同于事情效率与营业价值。。更合理的权衡指标应聚焦营业效果,,,好比使命交付效率、内容可用率、过失返工率、本钱节约额、营业立异效果等,,,从投入产出角度评估AI使用的真实效能。。

值得一提的是,,,随着算力账单的增添,,,一些科技公司最先审阅Token能否烧出价值。。好比,,,Uber首席运营官麦克唐纳德(Andrew Macdonald)在近期的一档播客中体现,,,更高的Token使用量并没有转化为一律、有用的功效增添,,,公司越来越难以为一连攀升的AI支出做出合明确释。。

业内也不乏质疑“唯Token论”的声音。。今年3月,,,Gartner研究副总裁孙鑫曾撰文指出,,,Token数目在结构上并不适用于评估AI乐成与否,,,反而可能误导企业机构的决议者,,,主要有三点原因:以Token为信号会导致错位激励; ;Token消耗与营业价值脱节; ;Token数目在手艺上无法实现厂商之间的直接较量。。

百度首创人李彦宏也在思索,,,AI时代的怀抱衡究竟是什么?? ?? ?他以为,,,Token只是代表本钱,,,并不代表收益; ;它权衡的是投入,,,而不是产出。。另外,,,Token消耗有没有用率、产出了什么价值——这些Token自己无法回覆。。

5月13日,,,李彦宏在Create2026百度AI开发者大会正式提出,,,进入智能体时代,,,权衡一个平台和生态的昌盛,,,比起Token消耗,,,更应该关注“日活智能体数”(Daily Active Agents,,,简称DAA),,,关注有几多Agent在给人类干活,,,并交付效果。。

此前,,,美国CRM(客户关系治理)巨头Salesforce实验提出一个新看法:智能体事情单位(AWU, Agentic Work Units),,,即智能体完成的一项自力使命,,,它代表原始算力真正转化为现实事情价值的历程——既可以是完成一次指令交互,,,也可以是走完一轮逻辑推理,,,更焦点的是完成一次工具挪用。。

自智能体兴起以来,,,行业以Token消耗量评判AI使用效果,,,但Token只能体现于AI的交互频次,,,无法权衡着实际落地的事情效果。。当企业试图将Token用量纳入KPI,,,有须要思索怎么阻止这样审核机制跑偏。。未来Token狂热会退散,,,怎样剔除无效的AI账单,,,回归价值创立自己,,,也是摆在企业眼前的必答题。。

采写:南都N视频记者李玲 发自北京

@林玉平:欧宝体育在线登录页,,,德国中医切脉查出记者甲状腺结节
@陈欣江:女生高考后以束脩之礼谢师恩
@林志贤:C罗姆巴佩哈兰德超燃天下杯短片

热门排行

【网站地图】