亚马逊叫停AI用量排行榜,,,把烧Token当绩效审核可行吗
亚马逊下线了一个追踪内部使用AI(人工智能)的排行榜,,,原因是员工刻意刷量,,,推高了公司算力本钱。。。。。
据《金融时报》5月29日报道,,,亚马逊在本周通知员工,,,旗下“Kirorank”榜单已阻止服务。。。。。这一榜单依托亚马逊内部开发者平台Kiro,,,原本用于给用户的AI活动量打分,,,设立初志是为推动AI在营业场景的应用,,,效果事与愿违。。。。。一些员工为追求排名,,,安排AI智能体执行无意义的操作,,,追求Token使用量最大化,,,造成公司算力资源太过消耗。。。。。
不止亚马逊一家,,,Meta、微软、谷歌等硅谷巨头也泛起内部比拼Tokenmaxxing(Token最大化)的情形。。。。。这股民俗还从硅谷伸张至中国,,,有网友发帖称海内个体大厂最先审核Token消耗量,,,将此与转正、年度绩效、提升挂钩。。。。。
当烧Token成为KPI,,,企业怎样阻止内部陷入“为用AI而用”、盲目刷量冲榜进而引发算力空耗的怪圈??更深层的问题是,,,Token消耗量高能否同于产出价值高??相比烧了几多Token,,,有无更成熟、稳固且可行的AI价值权衡标准??
硅谷“卷”Token用量
所谓Token是大模子处理文本的最小单位,,,每一次提醒词输入和模子输出都会消耗Token——1个Token既可以是一个单字,,,也可以是一个常见的词语,,,或者一个标点符号、空格。。。。。在海内,,,国家数据局于今年3月将Token译为“词元”,,,以为这不但是智能时代的价值锚点,,,更是毗连手艺供应与商业需求的“结算单位”。。。。。
随着AI应用的加速推进,,,Token的消耗正被越来越多厂商视为反映Al的生长规模和活跃水平的指标。。。。。在硅谷,,,迩来兴起了一股名为Tokenmaxxing(Token 最大化)的风潮——包括亚马逊、Meta、微软等科技巨头为勉励员工起劲使用AI工具,,,将此纳入审核指标,,,有的公司甚至设置内部排行榜,,,通过数据看板实时展示员工Token消耗数据。。。。。
以Meta为例,,,今年4月初,,,一名Meta员工开发了名为 “Claudeonomics” 的内部仪表盘,,,用来统计公司超8.5万员工的Token使用量,,,并展示了前250名的名字。。。。。据媒体报道,,,30天内,,,Meta全员“烧掉”了60万亿Token,,,排名第一的员工平均消耗2810亿Token——按Claude果真的API价钱折算,,,“榜一年迈”单月消耗了公司凌驾 140万美元的AI用度。。。。。不过这份榜单,,,被一家科技媒体曝光后已经下线,,,建设者体现“因数据被外部分享,,,决议暂时关闭。。。。。”
不止科技公司,,,流媒体巨头迪士尼也加入Tokenmaxxing行列,,,在内网上线了一块名为“AI Adoption Dashboard”的看板,,,实时展示员工挪用美国人工智能公司Anthropic旗下Claude模子的频率、请求次数、Token消耗量。。。。。
这些行为批注,,,一些公司治理层正在将Token消耗量纳入审核系统,,,用以权衡员工的AI能力。。。。。今年3月,,,英伟达CEO黄仁勋在GTC大会直言,,,若是一位年薪50万美元的工程师,,,一年消耗不掉25万美元的Token,,,他会深感焦虑。。。。;;迫恃购俺鲆裈oken当人为发,,,每年给工程师一笔相当于一半薪水的Token预算,,,“让他们的能力放大10倍”。。。。。
在以黄仁勋为代表的AI大佬的叙事框架里,,,Token正成为一种生产力指标,,,未来还可能酿成薪酬福利、新钱币。。。。。不过,,,这样的行业叙事也面临质疑,,,其中一个现实问题是,,,Token消耗涉及本钱问题,,,大宗的AI投入最终有几多转化成了有用的产出??当Token用量与审核绑定,,,这将激励员工进一步拥抱AI浪潮,,,照旧可能被异化??
亚马逊的实践案例,,,给出了一种谜底。。。。。5月29日,,,据《金融时报》报道,,,亚马逊近期关停了内部AI使用排行榜KiroRank。。。。。这一系统最初用于评估开发者平台 Kiro 的用户AI使用体现,,,但部分员工使用AI智能体执行大宗无效使命“刷榜”,,,致使亚马逊的算力本钱大幅攀升。。。。。
此前,,,亚马逊被曝设定审核目的,,,要求超80%的研发职员每周必需使用AI工具,,,并通过内部排行榜实时统计Token消耗量。。。。。为应对审核压力,,,不少员工泛起了刷数据的行为。。。。。
据亚马逊先容,,,这份榜单由部分员工自觉搭建,,,初志是让各人看到AI的赋能作用,,,公司的焦点目的是提升运营效率,,,但效果适得其反。。。。。亚马逊高级副总裁戴夫·特雷德韦尔(Dave Treadwell)申饬员工,,,“请不要为了用AI而用AI。。。。。”
另据媒体报道,,,亚马逊已最先改用“标准化安排量”作为新审核指标,,,更关注工程师用AI产出有用代码的频率,,,而非纯粹的Token消耗量。。。。。
当Token成为KPI,,,有人用腾贵的算力演出忙碌
除了亚马逊外,,,Meta等科技公司员工也被曝保存刻意刷Token消耗量、抬高内部排名的问题。。。。。怎样看待员工的Tokenmaxxing行为??
艾媒咨询CEO张毅告诉南都记者,,,硅谷企业推出Token消耗榜单,,,焦点是借助可量化数据快速推动AI工具普及,,,用排名竞争倒逼员工自动拥抱AI,,,加速企业数字化转型。。。。。但在排名压力下,,,员工必定会举行无效挪用,,,这不但铺张算力资源,,,还会疏散事情精神,,,违反AI降本增效的初志,,,也反映出企业AI治理系统保存短板。。。。。
大厂员工用腾贵的算力演出忙碌,,,问题事实出在那里??张毅直言,,,泉源在于企业用简朴的Token使用频次替价钱值审核,,,这种简单量化指标容易引发形式主义问题。。。。。
南都记者注重到,,,这股民俗也最先伸张至中国海内。。。。。近期,,,有网友发帖称某大厂绩效将参考Token消耗数据,,,或影响转正、年度绩效、提升。。。。。与此同时,,,为了勉励员工拥抱AI厘革,,,腾讯、阿里、字节等企业相继宣布了与Token有关的政策,,,包括提供内部AI工具的免费额度、外部购置AI工具可报销,,,为手艺和算法等焦点岗位设置Token津贴等,,,也有企业以优异案例评优、立异项目奖励等方式勉励员工使用AI。。。。。
当烧Token成为KPI,,,怎样阻止陷入“为用AI而用AI”的怪圈??张毅体现,,,Token消耗量仅直观反映AI挪用频次与使用活跃度,,,只能说明员工对AI工具的使用水平,,,无法直接等同于事情效率与营业价值。。。。。更合理的权衡指标应聚焦营业效果,,,好比使命交付效率、内容可用率、过失返工率、本钱节约额、营业立异效果等,,,从投入产出角度评估AI使用的真实效能。。。。。
值得一提的是,,,随着算力账单的增添,,,一些科技公司最先审阅Token能否烧出价值。。。。。好比,,,Uber首席运营官麦克唐纳德(Andrew Macdonald)在近期的一档播客中体现,,,更高的Token使用量并没有转化为一律、有用的功效增添,,,公司越来越难以为一连攀升的AI支出做出合明确释。。。。。
业内也不乏质疑“唯Token论”的声音。。。。。今年3月,,,Gartner研究副总裁孙鑫曾撰文指出,,,Token数目在结构上并不适用于评估AI乐成与否,,,反而可能误导企业机构的决议者,,,主要有三点原因:以Token为信号会导致错位激励;;Token消耗与营业价值脱节;;Token数目在手艺上无法实现厂商之间的直接较量。。。。。
百度首创人李彦宏也在思索,,,AI时代的怀抱衡究竟是什么??他以为,,,Token只是代表本钱,,,并不代表收益;;它权衡的是投入,,,而不是产出。。。。。另外,,,Token消耗有没有用率、产出了什么价值——这些Token自己无法回覆。。。。。
5月13日,,,李彦宏在Create2026百度AI开发者大会正式提出,,,进入智能体时代,,,权衡一个平台和生态的昌盛,,,比起Token消耗,,,更应该关注“日活智能体数”(Daily Active Agents,,,简称DAA),,,关注有几多Agent在给人类干活,,,并交付效果。。。。。
此前,,,美国CRM(客户关系治理)巨头Salesforce实验提出一个新看法:智能体事情单位(AWU, Agentic Work Units),,,即智能体完成的一项自力使命,,,它代表原始算力真正转化为现实事情价值的历程——既可以是完成一次指令交互,,,也可以是走完一轮逻辑推理,,,更焦点的是完成一次工具挪用。。。。。
自智能体兴起以来,,,行业以Token消耗量评判AI使用效果,,,但Token只能体现于AI的交互频次,,,无法权衡着实际落地的事情效果。。。。。当企业试图将Token用量纳入KPI,,,有须要思索怎么阻止这样审核机制跑偏。。。。。未来Token狂热会退散,,,怎样剔除无效的AI账单,,,回归价值创立自己,,,也是摆在企业眼前的必答题。。。。。
采写:南都N视频记者李玲 发自北京
@黄智德:色先锋资源,,,台湾新党副主席:民进党别扭曲大陆@杨佩芳:马刺大胜森林狼赢下天王山
@李淑萍:詹姆斯打高尔夫惹讼事面临??钭
热门排行
- 1 成人 免费 结九幺软件,视频
- 2 双人摇床运动
- 3 xxx v q pon
- 4 九九综合九九综合
- 5 女同一区二区
- 6 小红书破解版
- 7 18comic
- 8 核基地我为人人人人为我百度贴吧
- 9 一直草