月烧50万买Token,,,,我给AI发人为
中国互联网延续了20年的古板生涯规则——“依赖人力堆叠扩张”,,,,正在被一张张新账单彻底突破。。。。。。
50万元,,,,这是黄祯上一个月的账单,,,,用于购置Token。。。。。。
从香港中文大学休学后,,,,经由多次创业,,,,黄祯去年年底开办了TORKID。。。。。。在做这款产品的历程中,,,,他酿成了AI工程节点:数月内产出百万行通过测试的代码,,,,月Token消耗凌驾100亿,,,,相当于70亿~80亿个英文单词的文本量;;;;2025年7月,,,,他的Claude Code使用量一度进入某榜单全球前5。。。。。。
若是把一律规模的工程量放进一祖古板互联网大厂,,,,可能需要一名高阶软件工程师带着一个约20人的程序员团队一连推进。。。。。。但黄祯开办的TORKID加上兼职职员只有10余人,,,,其中焦点的软件工程师只有两人,,,,数以百万行计的代码并不是由人脑一行行敲出来的,,,,而是Claude Code、Codex等AI coding工具天生。。。。。。
这意味着,,,,一部分原本应该泛起在程序员“人为表”里的真金白银,,,,被悄然转移到被Agent消耗的Token中。。。。。。
已往20年,,,,中国互联网公司的扩张模式高度依赖“人力的扩张”。。。。。。以字节跳动为例,,,,在其营业高速向上增添的周期里,,,,员工规模在极短时间内跃升,,,,全球员工数激增数万人,,,,增幅凌驾35%。。。。。。然而,,,,这种依赖人力堆叠的组织惯性,,,,正在被大模子改变,,,,欺压企业重新评估“人”和“Token”的投入产出比。。。。。。
当Agent最先肩负原本由程序员完成的纯执行事情,,,,Token就不可阻止地转化为企业的新账单。。。。。。从创业者到互联网大厂,,,,再到云厂商、模子厂商和第三方算力运营商,,,,都已经被卷入这场由模子挪用驱动的本钱重构之中。。。。。。Token不再只是模子挪用的计量单位,,,,它正在酿成企业重新分配手艺预算、人力本钱和事情流入口的新本钱表。。。。。。
01、用Token换时间
黄祯不肯意简朴地把这笔钱界说为“买工具的开销”。。。。。。
TORKID是一个只为Agent提供清静、清洁的运行和办公情形的硬件——电脑。。。。。。在这套系统中,,,,人类治理者只需要饰演决议者角色:下达使命、视察效果。。。。。。至于详细的执行,,,,Agent会在硬件情形中自主地翻开网页、阅读文件、挪用种种第三方API工具并推进营业流程。。。。。。
若是仅仅盯着财务账面,,,,一个月50万元的coding Token消耗,,,,很容易被外界误读为这个首创团队在疯狂烧钱。。。。。。“事实上,,,,在包管准确性的条件下,,,,大模子帮我们镌汰了大宗的相同消耗,,,,极大地提高了效率。。。。。。”关于任何一家处于生死生死期的首创公司而言,,,,时间比款子更主要。。。。。。
“在古板的组织架构里,,,,要把一个想法酿成可落地的商业产品,,,,流程往往长得让人绝望。。。。。。你需要重复开会、对齐需求、拆解使命,,,,然后再分发给差别的前端、后端和测试工程师去推进。。。。。。在这条漫长的链路里,,,,中心只要有一个人明确偏了偏向,,,,或者架构师判断错了一个手艺细节,,,,后面迎来的就是灾难性的整体返工。。。。。。”黄祯直言,,,,这个历程消耗很是严重。。。。。。
大模子泛起后,,,,TORKID得以将这套冗长的流程极端压缩:白天团队只需要集中讨论两个小时,,,,定下框架,,,,然后将已经拆解好的使命直接扔给Claude Code等AI工具去实现,,,,若是模子的执行出了误差,,,,就就地修正提醒词,,,,让模子在几分钟内推倒重来,,,,继续执行。。。。。。
这种高强度的“人机协作”,,,,把这家公司的运转效率逼到了极限。。。。。。
从项目正式立项到完成硬件的全球预售渠道搭建,,,,TORKID仅仅用了7个月时间。。。。。。“若是没有AI的支持,,,,许多重大的工程模??,,,,我们这两个全职程序员基础做不出来。。。。。。若是把治理一个大型研发团队的相同本钱、开会本钱全都折算进来,,,,我们现在一天做成的事情,,,,可能相当于已往古板团队两到三周的交付。。。。。。”
黄祯给《财经天下》算过一笔账:已往半年,,,,TORKID在纯Token和AI coding消耗上的累计投入已经抵达100多万元。。。。。。可是相较于古板公司,,,,“人”效比或许为1:5。。。。。。这意味着,,,,在AI辅助的模式下,,,,他掏出1元买Token,,,,古板团队想要抵达一律的研发进度,,,,可能需要在人力本钱上砸进去5元。。。。。。
这张Token账单蕴含更为深远的意义:它重塑了首创公司的组织模子。。。。。。关于首创公司,,,,Token账单不但是一种消耗,,,,更是一种高效率的“组织杠杆”。。。。。。
这意味着,,,,未来,,,,或许创业公司不需要先把每个岗位补齐,,,,再逐步推进产品,,,,而是先把使命拆给模子,,,,让Agent和coding工具肩负一部分执行事情,,,,再决议哪些岗位真的需要泛起。。。。。。
在黄祯的设想里,,,,TORKID未来会由三部分组成:底层硬件仍然需要人来操作;;;;中心是焦点内核研发团队,,,,围绕Agent Runtime、推理和Context优化睁开,,,,规;;;;岜豢刂圃诤苄」婺D;;;;再往上,,,,是面向差别用户群体睁开的用户体验和市场团队。。。。。。详细执行都交Agent。。。。。。
换句话说,,,,未来,,,,许多公司都不再需要纯执行岗位,,,,需要的是“治理执行一体”的人。。。。。。
黄祯只是无数AI原生创业者中的一个。。。。。。全球大模子巨头Anthropic披露的早期官方数据显示,,,,创业公司已经成为Claude Code最焦点的拥趸。。。。。。在Claude Code的所有日常对话交互中,,,,来自首创公司相关工程的挪用占比高达32.9%,,,,这一数字远远凌驾了创业公司在通例Claude.ai网页端对话中的占比。。。。。。
这种转变同样被投资人捕获到。。。。。。真格基金与十字路口Crossing提倡Token Grant时明确,,,,对许多AI创业者来说,,,,最缺的未必是团队、办公室或第一笔人为,,,,而是把想法快速做成第一版所需要的模子与算力资源,,,,并宣布为每个入选项目提供5万元Token用度津贴。。。。。。
这意味着,,,,投资人已经把Token看成一种早期创业资源。。。。。。已往投资人看团队、看产品、看增添,,,,现在对AI原生项目来说,,,,还要看首创人有没有足够的模子挪用能力,,,,能不可一连试错,,,,快速把想法落地。。。。。。Token消耗量自己未必是唯一指标,,,,但它正在酿成投资人考察创业公司值不值得被投的一个主要指标。。。。。。
02、Token不再只是手艺部分的小账
在更多公司里,,,,Token消耗已经从手艺部分的小账,,,,酿成公司的结构性本钱。。。。。。
三年前,,,,许多团队做AI漫剧,,,,主要用开源模子和云算力。。。。。。“一张4090的卡,,,,一小时使用不到两元,,,,凭证员工的使用量,,,,一个月下来整体五百元以内可以搞定。。。。。。”从事漫剧制作的创业者李铭对《财经天下》体现,,,,随着模子能力一直更新,,,,闭源模子和开源模子之间的差别被拉大,,,,效果也“肉眼可见”。。。。。。同时,,,,AI漫剧也越来越卷,,,,用户对画面、逻辑要求越来越高。。。。。。
本钱也爆发了显著转变。。。。。。“Seedance出来后,,,,一段3秒视频天生基本要1元。。。。。。叠加修改、重试等,,,,AI漫剧每分钟需约1000—3000元,,,,制作一部精品AI漫剧需要20万元左右。。。。。。”李铭体现,,,,AI漫剧本钱主要包括算力、人力、版权等,,,,其中算力本钱占比最高,,,,或许30%~50%。。。。。。
这也是许多AI应用公司正在履历的悖论:模子挪用让产品看起来更智能,,,,但也让产品交付变得更贵。。。。。。
AI应用公司首创人刘斌对《财经天下》算过另一笔账:公司目今Token消耗在10亿级别,,,,产品还在内测阶段的时间,,,,场景可控,,,,本钱也可控。。。。。。但用户数目上来后,,,,就会爆发大宗的消耗,,,,算力账单会迅速膨胀。。。。。。他得出了一个结论:不可带来收益的产品,,,,绝对买不起算力。。。。。。
“现在,,,,公司勉励团队使用Token,,,,但整体支出需要控制在预算包内,,,,营业部分最终还要用ROI来权衡收益。。。。。。”一家主要做营销的科技公司的高管陈明对《财经天下》体现。。。。。。
同样,,,,为了节约Token消耗,,,,每家公司都在精打细算。。。。。。一位不肯签字的业内人士给《财经天下》透露了一个看来近乎荒唐、却真实有用的操作:一家金融公司,,,,每月Token消耗已经抵达千亿量级,,,,营业应用侧逐日稳固在亿级消耗。。。。。。为了节约Token,,,,这家公司勉励团队用“文言文”压缩Token。。。。。。
“在部分离线场景中,,,,先让高性能模子输出文言文,,,,可让Token消耗镌汰40%到50%,,,,再用自制的国产模子翻译回口语,,,,整体账单最多能节约约70%。。。。。。”上述人士体现,,,,只管这样会带来信息消耗,,,,但当Token进入千亿量级,,,,企业会像抠电费一样抠Token。。。。。。
这种转变说明,,,,Token已经不再只是手艺部分的资源消耗,,,,最先进入营业部分的谋划判断。。。。。。在一些企业里,,,,省Token已经酿成一门新的本钱治理手艺。。。。。。
这种转变不但爆发在首创团队身上。。。。。。2026年4月,,,,Google CEO Sundar Pichai在Cloud Next上透露,,,,谷歌近75%的新增代码由AI天生,,,,经工程师审核确认后入库落地,,,,一项重大代码迁徙使命由工程师与AI Agent协作落地,,,,完成速率比一年前全人工开发快6倍。。。。。。
果真研究也在说明统一个趋势。。。。。。PwC在2025年宣布的Global AI Jobs Barometer中剖析了靠近10亿条招聘广告和数千份企业财报后发明,,,,具备AI手艺的员工,,,,相比同岗位但不具备AI手艺的人,,,,平均保存56%的人为溢价。。。。。。尚有数据显示,,,,77%的雇主妄想对员工举行再培训,,,,但同时也有41%的雇主妄想由于AI自动化部分使命而缩减员工规模。。。。。。
中国生长高层论坛2026年年会披露,,,,2024年头,,,,中国日均Token挪用量约为1000亿,,,,2026年3月日均挪用量突破140万亿,,,,两年增添凌驾千倍。。。。。。
当Token从研发工具进入内容生产、用户交付和企业流程,,,,它就不再只是手艺部分的小账,,,,而是营业认真人、手艺认真人和财务认真人都绕不开的一张本钱表。。。。。。它既可能提高效率,,,,也可能吞掉利润;;;;既可能替换一部分人力,,,,也可能酿成另一笔更难控制的刚性支出。。。。。。
新的问题已然泛起:当越来越多企业最先把一部分人力本钱转成Token账单,,,,这张新的“人为表”最后会由谁收走???一场蓄谋已久、针对企业“事情流入口”的圈地大围猎正式开启。。。。。。
03、谁来掌控这张“人为表”???
对创业者来说,,,,Token是用来换时间、换效率的工具;;;;对企业来说,,,,它是一笔必需被纳入ROI盘算的新本钱。。。。。。但对云厂商、大模子厂商和互联网大厂来说,,,,企业每一次挪用模子、每一次让Agent执行使命,,,,都是一笔可以一连收割的账单。。。。。。
半年前,,,,阿里云智能集团资深副总裁刘伟光对Token支出在企业IT预算中的占比判断,,,,还只是“可能都不到1%”。。。。。。到了2026年5月,,,,这个判断已经爆发巨变:对AI原生创业公司来说,,,,Token支出可以占到IT支出的100%;;;;在中国互联网企业里,,,,这一比例也抵达了15%~20%。。。。。。
据36氪报道,,,,阿里云今年的目的是,,,,到年底,,,,在每一个客户孝顺的收入中,,,,Token收入占比不低于20%。。。。。。
这个目的背后,,,,是云厂商对企业预算表的一次重新明确。。。。。。刘伟光曾坦言,,,,在云盘算时代,,,,盘货客户IT预算时,,,,有一部分钱阿里云始终吃不到:企业内部的软件开发和人力外包。。。。。。但AI Coding泛起后,,,,这部分预算反而成了大模子可以直接掷中的地方。。。。。。
恒久聚焦AI工业投资的基金司理杨勇把这件事说得更直接:Token时代,,,,大厂的竞争已经从模子能力竞赛,,,,转向“经济系统构建”,,,,组织从疏散赛马转向中枢协同;;;;商业模式也要从已往互联网式的 “烧钱换流量”转向 “Token计费变现”。。。。。。
这也是MaaS(模子即服务)突然变得主要的原因。。。。。。已往,,,,云厂商卖的是服务器、存储、带宽和数据库;;;;现在,,,,它们更希望把模子、API、Agent Runtime、安排服务和计费系统一起打包进客户的营业流程里。。。。。。
一旦企业的代码天生、营销等内部运营流程都接入某个平台,,,,Token就会从一次性投入酿成一连性消耗。。。。。。为了抢夺这20%的收入,,,,巨头们最直接的手段依旧是惨烈但高效的价钱战,,,,谁掌控了企业的模子挪用入口,,,,谁就更靠近未来的事情流账单。。。。。。
2026年5月,,,,DeepSeek宣布,,,,在2.5折限时优惠竣事后,,,,将DeepSeek-V4-Pro API正式价钱调解为原价的四分之一。。。。。。也就是说,,,,原本阶段性的低价,,,,成为恒久官价;;;;小米旗下的MiMo-V2.5系列API随后跟进,,,,高调宣布周全大降价,,,,最高降幅达99%。。。。。。此前,,,,阿里、字节、腾讯等厂商都履历过多轮的价钱拉锯。。。。。。
“TORKID和字节、阿里等厂商都接触过,,,,除了价钱优势,,,,它们还提供了种种代金券,,,,想让我使用它们的模子。。。。。。”黄祯有很直接的体感,,,,但他很清晰,,,,代金券、低价资源包的吸引力终究有限,,,,他更在乎模子的质量与稳固性。。。。。。
互联网大厂正在试图把更多企业的事情流纳入自己的模子和云服务系统:将差别事情场景下的能力模??榉庾俺葾gent服务或事情流方案,,,,再通过模子挪用、Token计费和云资源绑定,,,,争取企业未来的挪用入口和账单归属。。。。。。同样,,,,第三方自力算力运营商也在转型。。。。。。
作为重资产结构的代表,,,,武汉元熙映阙人工智能基础资源手艺平台有限公司(以下简称“元熙”)在湖北、新疆等地结构了3座备案智算中心,,,,妄想总算力超10000P,,,,手握6000P恒久算力租赁订单。。。。。;;;;俊PU、电力、网络、液冷,,,,全都是真金白银的硬投入。。。。。。
在巨头把Token价钱“打骨折”的MaaS时代,,,,企业买的越来越不是裸算力,,,,而是包装在事情流里的Token和模子服务。。。。。。??梢栽ぜ氖,,,,元熙若是只做“房东”卖裸算力,,,,就会被压成“谁自制用谁”的暂时资源池,,,,失去议价权。。。。。。
“我们也在实验分时租赁,,,,把闲时算力租给科研机构、高;;;;蛑行∑笠,,,,尽可能提高GPU使用率。。。。。。”元熙副总裁杨楠对《财经天下》体现,,,,元熙已最先转型,,,,起劲向MaaS、Agent服务、AI Skill封装和Token计费靠拢 ,,,,让产品形态更为富厚。。。。。。
“这部分营业早期纷歧定连忙收费,,,,更像获客:先让自己的软件或挪用入口进入客户系统,,,,等客户侧功效被激活,,,,用户最先爆发AI挪用后,,,,再凭证挪用量或Token消耗举行分成。。。。。。” 杨楠体现。。。。。。
这种转型,,,,也是当下AI工业巨变的一个缩影。。。。。。毫无疑问,,,,在这个拥挤的赛道上,,,,玩家想要留在牌桌上,,,,都必需不遗余力。。。。。。
(文中李铭、刘斌、陈明均为匿名)
(作者 | 南风,,,,编辑 | 春野,,,,图片泉源 | 视觉中国,,,,本内容转载自财经天下WEEKLY)
文章点评
未盘问到任何数据!
揭晓谈论
◎接待加入讨论,,,,请在这里揭晓您的看法、交流您的看法。。。。。。