凯时AG

泉源:本周我国多领域迎来硬核突破作者: 陈淑彦:

亚马逊叫停AI用量排行榜 ,,,,,,把烧Token当绩效审核可行吗

亚马逊下线了一个追踪内部使用AI(人工智能)的排行榜 ,,,,,,原因是员工刻意刷量 ,,,,,,推高了公司算力本钱 。。 。。。

据《金融时报》5月29日报道 ,,,,,,亚马逊在本周通知员工 ,,,,,,旗下“Kirorank”榜单已阻止服务 。。 。。。这一榜单依托亚马逊内部开发者平台Kiro ,,,,,,原本用于给用户的AI活动量打分 ,,,,,,设立初志是为推动AI在营业场景的应用 ,,,,,,效果事与愿违 。。 。。。一些员工为追求排名 ,,,,,,安排AI智能体执行无意义的操作 ,,,,,,追求Token使用量最大化 ,,,,,,造成公司算力资源太过消耗 。。 。。。

不止亚马逊一家 ,,,,,,Meta、微软、谷歌等硅谷巨头也泛起内部比拼Tokenmaxxing(Token最大化)的情形 。。 。。。这股民俗还从硅谷伸张至中国 ,,,,,,有网友发帖称海内个体大厂最先审核Token消耗量 ,,,,,,将此与转正、年度绩效、提升挂钩 。。 。。。

当烧Token成为KPI ,,,,,,企业怎样阻止内部陷入“为用AI而用”、盲目刷量冲榜进而引发算力空耗的怪圈?????更深层的问题是 ,,,,,,Token消耗量高能否同于产出价值高?????相比烧了几多Token ,,,,,,有无更成熟、稳固且可行的AI价值权衡标准?????

硅谷“卷”Token用量

所谓Token是大模子处理文本的最小单位 ,,,,,,每一次提醒词输入和模子输出都会消耗Token——1个Token既可以是一个单字 ,,,,,,也可以是一个常见的词语 ,,,,,,或者一个标点符号、空格 。。 。。。在海内 ,,,,,,国家数据局于今年3月将Token译为“词元” ,,,,,,以为这不但是智能时代的价值锚点 ,,,,,,更是毗连手艺供应与商业需求的“结算单位” 。。 。。。

随着AI应用的加速推进 ,,,,,,Token的消耗正被越来越多厂商视为反映Al的生长规模和活跃水平的指标 。。 。。。在硅谷 ,,,,,,迩来兴起了一股名为Tokenmaxxing(Token 最大化)的风潮——包括亚马逊、Meta、微软等科技巨头为勉励员工起劲使用AI工具 ,,,,,,将此纳入审核指标 ,,,,,,有的公司甚至设置内部排行榜 ,,,,,,通过数据看板实时展示员工Token消耗数据 。。 。。。

以Meta为例 ,,,,,,今年4月初 ,,,,,,一名Meta员工开发了名为 “Claudeonomics” 的内部仪表盘 ,,,,,,用来统计公司超8.5万员工的Token使用量 ,,,,,,并展示了前250名的名字 。。 。。。据媒体报道 ,,,,,,30天内 ,,,,,,Meta全员“烧掉”了60万亿Token ,,,,,,排名第一的员工平均消耗2810亿Token——按Claude果真的API价钱折算 ,,,,,,“榜一年迈”单月消耗了公司凌驾 140万美元的AI用度 。。 。。。不过这份榜单 ,,,,,,被一家科技媒体曝光后已经下线 ,,,,,,建设者体现“因数据被外部分享 ,,,,,,决议暂时关闭 。。 。。。”

不止科技公司 ,,,,,,流媒体巨头迪士尼也加入Tokenmaxxing行列 ,,,,,,在内网上线了一块名为“AI Adoption Dashboard”的看板 ,,,,,,实时展示员工挪用美国人工智能公司Anthropic旗下Claude模子的频率、请求次数、Token消耗量 。。 。。。

这些行为批注 ,,,,,,一些公司治理层正在将Token消耗量纳入审核系统 ,,,,,,用以权衡员工的AI能力 。。 。。。今年3月 ,,,,,,英伟达CEO黄仁勋在GTC大会直言 ,,,,,,若是一位年薪50万美元的工程师 ,,,,,,一年消耗不掉25万美元的Token ,,,,,,他会深感焦虑 。。 。。;;;;迫恃购俺鲆裈oken当人为发 ,,,,,,每年给工程师一笔相当于一半薪水的Token预算 ,,,,,,“让他们的能力放大10倍” 。。 。。。

在以黄仁勋为代表的AI大佬的叙事框架里 ,,,,,,Token正成为一种生产力指标 ,,,,,,未来还可能酿成薪酬福利、新钱币 。。 。。。不过 ,,,,,,这样的行业叙事也面临质疑 ,,,,,,其中一个现实问题是 ,,,,,,Token消耗涉及本钱问题 ,,,,,,大宗的AI投入最终有几多转化成了有用的产出?????当Token用量与审核绑定 ,,,,,,这将激励员工进一步拥抱AI浪潮 ,,,,,,照旧可能被异化?????

亚马逊的实践案例 ,,,,,,给出了一种谜底 。。 。。。5月29日 ,,,,,,据《金融时报》报道 ,,,,,,亚马逊近期关停了内部AI使用排行榜KiroRank 。。 。。。这一系统最初用于评估开发者平台 Kiro 的用户AI使用体现 ,,,,,,但部分员工使用AI智能体执行大宗无效使命“刷榜” ,,,,,,致使亚马逊的算力本钱大幅攀升 。。 。。。

此前 ,,,,,,亚马逊被曝设定审核目的 ,,,,,,要求超80%的研发职员每周必需使用AI工具 ,,,,,,并通过内部排行榜实时统计Token消耗量 。。 。。。为应对审核压力 ,,,,,,不少员工泛起了刷数据的行为 。。 。。。

据亚马逊先容 ,,,,,,这份榜单由部分员工自觉搭建 ,,,,,,初志是让各人看到AI的赋能作用 ,,,,,,公司的焦点目的是提升运营效率 ,,,,,,但效果适得其反 。。 。。。亚马逊高级副总裁戴夫·特雷德韦尔(Dave Treadwell)申饬员工 ,,,,,,“请不要为了用AI而用AI 。。 。。。”

另据媒体报道 ,,,,,,亚马逊已最先改用“标准化安排量”作为新审核指标 ,,,,,,更关注工程师用AI产出有用代码的频率 ,,,,,,而非纯粹的Token消耗量 。。 。。。

当Token成为KPI ,,,,,,有人用腾贵的算力演出忙碌

除了亚马逊外 ,,,,,,Meta等科技公司员工也被曝保存刻意刷Token消耗量、抬高内部排名的问题 。。 。。。怎样看待员工的Tokenmaxxing行为?????

艾媒咨询CEO张毅告诉南都记者 ,,,,,,硅谷企业推出Token消耗榜单 ,,,,,,焦点是借助可量化数据快速推动AI工具普及 ,,,,,,用排名竞争倒逼员工自动拥抱AI ,,,,,,加速企业数字化转型 。。 。。。但在排名压力下 ,,,,,,员工必定会举行无效挪用 ,,,,,,这不但铺张算力资源 ,,,,,,还会疏散事情精神 ,,,,,,违反AI降本增效的初志 ,,,,,,也反映出企业AI治理系统保存短板 。。 。。。

大厂员工用腾贵的算力演出忙碌 ,,,,,,问题事实出在那里?????张毅直言 ,,,,,,泉源在于企业用简朴的Token使用频次替价钱值审核 ,,,,,,这种简单量化指标容易引发形式主义问题 。。 。。。

南都记者注重到 ,,,,,,这股民俗也最先伸张至中国海内 。。 。。。近期 ,,,,,,有网友发帖称某大厂绩效将参考Token消耗数据 ,,,,,,或影响转正、年度绩效、提升 。。 。。。与此同时 ,,,,,,为了勉励员工拥抱AI厘革 ,,,,,,腾讯、阿里、字节等企业相继宣布了与Token有关的政策 ,,,,,,包括提供内部AI工具的免费额度、外部购置AI工具可报销 ,,,,,,为手艺和算法等焦点岗位设置Token津贴等 ,,,,,,也有企业以优异案例评优、立异项目奖励等方式勉励员工使用AI 。。 。。。

当烧Token成为KPI ,,,,,,怎样阻止陷入“为用AI而用AI”的怪圈?????张毅体现 ,,,,,,Token消耗量仅直观反映AI挪用频次与使用活跃度 ,,,,,,只能说明员工对AI工具的使用水平 ,,,,,,无法直接等同于事情效率与营业价值 。。 。。。更合理的权衡指标应聚焦营业效果 ,,,,,,好比使命交付效率、内容可用率、过失返工率、本钱节约额、营业立异效果等 ,,,,,,从投入产出角度评估AI使用的真实效能 。。 。。。

值得一提的是 ,,,,,,随着算力账单的增添 ,,,,,,一些科技公司最先审阅Token能否烧出价值 。。 。。。好比 ,,,,,,Uber首席运营官麦克唐纳德(Andrew Macdonald)在近期的一档播客中体现 ,,,,,,更高的Token使用量并没有转化为一律、有用的功效增添 ,,,,,,公司越来越难以为一连攀升的AI支出做出合明确释 。。 。。。

业内也不乏质疑“唯Token论”的声音 。。 。。。今年3月 ,,,,,,Gartner研究副总裁孙鑫曾撰文指出 ,,,,,,Token数目在结构上并不适用于评估AI乐成与否 ,,,,,,反而可能误导企业机构的决议者 ,,,,,,主要有三点原因:以Token为信号会导致错位激励;;;;Token消耗与营业价值脱节;;;;Token数目在手艺上无法实现厂商之间的直接较量 。。 。。。

百度首创人李彦宏也在思索 ,,,,,,AI时代的怀抱衡究竟是什么?????他以为 ,,,,,,Token只是代表本钱 ,,,,,,并不代表收益;;;;它权衡的是投入 ,,,,,,而不是产出 。。 。。。另外 ,,,,,,Token消耗有没有用率、产出了什么价值——这些Token自己无法回覆 。。 。。。

5月13日 ,,,,,,李彦宏在Create2026百度AI开发者大会正式提出 ,,,,,,进入智能体时代 ,,,,,,权衡一个平台和生态的昌盛 ,,,,,,比起Token消耗 ,,,,,,更应该关注“日活智能体数”(Daily Active Agents ,,,,,,简称DAA) ,,,,,,关注有几多Agent在给人类干活 ,,,,,,并交付效果 。。 。。。

此前 ,,,,,,美国CRM(客户关系治理)巨头Salesforce实验提出一个新看法:智能体事情单位(AWU, Agentic Work Units) ,,,,,,即智能体完成的一项自力使命 ,,,,,,它代表原始算力真正转化为现实事情价值的历程——既可以是完成一次指令交互 ,,,,,,也可以是走完一轮逻辑推理 ,,,,,,更焦点的是完成一次工具挪用 。。 。。。

自智能体兴起以来 ,,,,,,行业以Token消耗量评判AI使用效果 ,,,,,,但Token只能体现于AI的交互频次 ,,,,,,无法权衡着实际落地的事情效果 。。 。。。当企业试图将Token用量纳入KPI ,,,,,,有须要思索怎么阻止这样审核机制跑偏 。。 。。。未来Token狂热会退散 ,,,,,,怎样剔除无效的AI账单 ,,,,,,回归价值创立自己 ,,,,,,也是摆在企业眼前的必答题 。。 。。。

采写:南都N视频记者李玲 发自北京

@杨雅恩:差差差30分钟轮滑不用下载 ,,,,,,小心远程控制软件藏窃密通道
@左纯安:湖南衡阳一商铺爆发火灾致5死1伤
@李俊秋:曝巴萨篮球俱乐部有意上外洋援古德温

【网站地图】