凯时AG

a16z 合资人:大模子吃掉通用使命, ,,创业公司吃掉笔直行业

作者:张家人
宣布时间:2026-06-15 09:04:52
阅读量:4

a16z 合资人:大模子吃掉通用使命, ,,创业公司吃掉笔直行业

最近半年, ,,险些每一个 AI 创业者都会有一个疑问:OpenAI 和 Anthropic 会不会把我们全吃掉??模子越来越强, ,,Codex 和 Claude Code 越来越像操作系统, ,,那应用层尚有得做吗??

硅谷顶级风投 a16z 的合资人 Joe Schmidt 专门写了一篇文章回应这个问题。。。 。。他的焦点判断是:大模子公司的主攻偏向(代码天生、写作、图像创作等通用使命)确实是创业公司的禁区, ,,但在这条“黄砖路”之外, ,,尚有大宗重大、笔直的问题实验室基础够不到, ,,真正的时机在那些需要让 AI 输出可信、合规、能在详细行业里运转的地方。。。 。。

创业公司可以靠四道护城河守住阵地:行业隐性知识积累成的数据飞轮、跨厂商跨模子选最优解的无邪性、按使命难度分级路由的本钱优势、以及帮客户吸收羁系重大性的治理能力。。。 。。他用一句话概括这场博弈:模子可以替换, ,,但深耕行业的事情系统不可。。。 。。

以下为编译。。。 。。

每个人都在问:AI 应用层尚有得做吗??

我最近被首创人和求职者重复问统一个问题:AI 应用层尚有没有空间??照旧说 OpenAI 和 Anthropic 会吃掉一切??

这问题背后有一种特殊的 AI 焦虑症。。。 。。一些人已经认定, ,,唯一能阻止沦为永世底层的位置, ,,要么在大模子实验室里, ,,要么在机械人、硬科技这类“实验室碰不到”的前沿地带。。。 。。若是每一款软件都注定被吃掉, ,,要么被 Codex 或 Claude 直接吸收掉事情流, ,,要么被下一代模子直接酿成多余, ,,那就赶忙跑吧。。。 。。

听着, ,,我险些比谁都更 AI 原教旨主义, ,,并且我以为他们只说对了一半。。。 。。实验室确实会吞掉一大片应用层。。。 。。但“应用层”不是一个同质化的时机池。。。 。。准确的思索框架是:你站在黄砖路上, ,,照旧奥兹国的其他地方??

大模子公司吃通用使命, ,,创业公司吃笔直行业

“黄砖路”是我们对大模子公司主攻偏向的简称, ,,它们在这条路上投入了极其重大的资源。。。 。。代码天生、写作、图像创作这类问题之以是自然属于实验室, ,,是由于这些问题随着模子原始能力的提升会直接变好:每一块钱的预训练和后训练支出, ,,都会直接改善产品体验。。。 。。

若是你在创业, ,,黄砖路是最显着的偏向, ,,也是最危险的偏向。。。 。。拿一个高性能模子, ,,接上几个现成的毗连器(Google Drive、Slack、Salesforce、Notion、GitHub), ,,再在上面搭一层署理编排, ,,看起来像变魔术一样简朴。。。 。。

问题是, ,,这就是实验室在做的事情。。。 。。他们虽然拥有模子自己, ,,这意味着更好的利润率、更强的控制力, ,,以及对下游所有加入者的定价权。。。 。。但更主要的是, ,,他们也拥有决议产品架构的权力, ,,产品为哪些问题而设计、用什么方式来解决。。。 。。他们到现在为止一直在刻意选择“模子加工具挪用”的模式, ,,而这恰恰是黄砖路上那些水平化、低步数使命所需要的。。。 。。

退一步说, ,,就算有创业公司能在产品上跑赢 Codex 或 Claude Code, ,,实验室手里还握着重大的分发渠道和 AI 领域最强的品牌光环。。。 。。若是你是一家 AI 应用公司, ,,用同样的毗连器、同样的模式、没有底层子署理或深度设置、也没有自己的分发能力, ,,那你或许率走在一条通往“那里都不是”的路上。。。 。。

但对创业公司来说, ,,这不是通盘气馁的时势。。。 。。;;;;谱┞分庥兄卮蟮氖被, ,,创业公司可以在那里真正拥有客户、解决重大问题。。。 。。

这些公司构建的是署理式体验, ,,模子被编织进一张由工具、自动化、集成组成的重大网络里。。。 。。这使得它们自然是笔直化的。。。 。。它们可以做多步、多角色协作的事情, ,,拥有针对特定角色和笔直场景的子署理, ,,而这些都是 Anthropic 和 OpenAI 用水平化平台无法触及的:跨系统网络上下文, ,,然后在差别阶段由多个人审批流转。。。 。。这些场景往往涉及一个或多个遗留系统, ,,倾向于需要确定性的效果, ,,模糊是不可接受的, ,,并且最终经常绑在某个有价值的营业效果上。。。 。。

实验室很清晰这些问题的价值:他们之以是在搭建自己的外包设置团队, ,,以及为什么会泛起一整个面向大客户的强化学习工业, ,,原因就在这里。。。 。。

对此最常见的反驳是:历史上押注“模子不会变好”历来都是糟糕的赌注。。。 。。它们或许会一直变强, ,,最终吃掉这些应用层公司的市场。。。 。。

实验室虽然会继续前进, ,,但我以为奥兹国其余地区的公司有几道护城河可以守住。。。 。。

第一, ,,数据和学习的飞轮。。。 。。 许多知识不在任何训练集里, ,,不可文的行业老例、没有文档纪录的标准、只保存于从业者头脑里的隐性知识。。。 。。这些全都不在果真网页上。。。 。。再多逊с力也替换不了真正嵌入这些知识所在的营业流。。。 。。这里有两个叠加的飞轮:跨客户飞轮, ,,当你看到统一种问题的更多变体时涌现的模式;;;;;以及单个客户内部飞轮, ,,详细决议背后的原因、未说出口的破例、公司自己不可文的履历规则, ,,这些只有在与系统的真实交互中才会浮现。。。 。。

纵然客户数据不可在客户之间直接使用, ,,应用公司依然可以使用跨客户问题类型的模式识别, ,,来指导未来问题的架构设计。。。 。。一个让署理跑过一百次执法红线审查、一千次包管核保周期、一万次销售开发代表使命的公司, ,,已经把问题的“形状”内化了, ,,这种积累是下一个新进入者用一套全新署理重新最先无法复制的。。。 。。

第二, ,,治理模子的转变与重大性。。。 。。 实验室已经在做内部路由了, ,,差别请求调差别模子种别、底层用集成。。。 。。但他们做不到跨厂商路由, ,,不可用竞争敌手的模子来评估某个子使命, ,,也不可为一个极窄的环节专门用开源微调。。。 。。奥兹国公司可以在整个模子市场中为每一个子使命选最优模子, ,,而不是只能用母公司发货的那一个。。。 。。他们还做了没人想做的事情T媚课新模子宣布时重新跑评估、针对客户边沿场景重新校准提醒词、在不炸掉生产情形的条件下完成安排。。。 。。实验室不会替客户做这些;;;;;他们把下一个模子卖给你, ,,让你自己迁徙。。。 。。奥兹国公司帮客户吸收掉迁徙本钱。。。 。。?突Щ竦玫氖钦鍪谐∽钣胖悄艿淖楹, ,,以及每次升级时无感的一连性。。。 。。

第三, ,,本钱优化。。。 。。 每个盘问都跑 Opus 4.7 是通往负毛利的最快路径。。。 。。最好的奥兹国公司在差别级别的模子之间做路由, ,,最难的使命用前沿模子, ,,大部分用中端模子, ,,在已经取得足够积累的环节用更小的定制或微调模子。。。 。。有些公司现在更进一步, ,,在这些基础上做自己的后训练, ,,针对客户体贴的极窄事情流做优化, ,,服务本钱只是前沿 API 挪用价钱的零头。。。 。。实验室定的是智能的底价:花 X 元能买到的最低智能。。。 。。奥兹国公司卖的是反过来的工具:为事情流现实所需的智能水平, ,,找到最低的美元本钱。。。 。。这只有在你准确知道每个子使命需要什么水平时才可能, ,,而实验室在结构上不可能相识所有笔直行业。。。 。。

第四, ,,治理。。。 。。 成为客户在某个笔直行业使用 AI 的“控制平面”, ,,这件事自己就有相当大的价值, ,,权限、审计、署理被允许做什么、署理现实做了什么, ,,所有汇聚于一处。。。 。。这个控制平面由详细场景的护栏组成, ,,而差别行业、差别岗位需要的护栏完全差别。。。 。。由于奥兹国公司拥有端到端的工具、事情流和数据, ,,他们能在水平工具难以企及的地方提供确定性效果。。。 。。他们也是替最终客户吸收羁系重大性的实体:执法行业的 FRCP 和状师规则、医疗领域的 HIPAA、金融领域的 SEC 和 FINRA、各州包管规则等等。。。 。。一个水平化玩家若是不酿成一百个差别的笔直行业公司, ,,就不可能真正承接这些责任。。。 。。CIO 们想要的是一个能在条约里白纸黑字写明“我会为提供的署理肩负合规责任”的相助同伴。。。 。。

所有这些都指向统一件事:专注。。。 。。?梢允且桓霰手毙幸担ò堋⒅捶ā⒒峒疲, ,,也可以是一个做深做透的功效(销售、客服、财务)。。。 。。无论哪种, ,,都需要一支团队全身心扎进一组客户里, ,,它的事情流、它的边沿场景、它的羁系规则。。。 。。实验室不是为这个设计的。。。 。。他们必需同时笼罩所有人, ,,这是他们铺出黄砖路的方式。。。 。。同样的取舍也让他们进不了奥兹国的其余地区, ,,你可以同时无处不在, ,,也可以在一件事上做到极致。。。 。。二者不可兼得。。。 。。

销售的例子:重大营业需要什么

怎么在实践中思索这件事??11x 的 CEO Prabhav Jain 给出了一些来自一线的建议。。。 。。

从客户真正体贴的效果出发。。。 。。 对 11x 来说, ,,就是帮客户爆发更多销售管道。。。 。。从这个问题出发, ,,追问就变得极其详细:我们希望端到端拥有哪些真正驱动管道的活动??把每个活动剖析成使命, ,,哪些是署理式的、哪些不是, ,,哪些需要深度的领域洞察、哪些不需要。。。 。。实验室虽然也会宣布事情流, ,,但当流程有许多方法、输入很脏、状态很难剖析、保存种种现实天下约束时, ,,单靠更好的模子是做不到的。。。 。。这部分事情回到古板软件工程, ,,而实验室在一个专注的应用公司眼前没有任何优势。。。 。。

举个例子, ,,11x 处理的使命包括:基于自界说信号做线索挖掘、线索数据增补、深度账户研究、从 CRM 中抓取上下文、针对差别渠道的新闻天生、线索质量判断署理、邮件送达系统。。。 。。这些不是一次性就能完成的使命, ,,需要深度工程。。。 。。

奥兹国比喻中最要害的一个洞察是:在任何一个真实事情流里, ,,约莫有一半非署理式使命, ,,实验室在这些使命上没有任何优势, ,,他们写模子层下面简直定性软件, ,,并不比你强。。。 。。另一半署理式使命, ,,仍然需要你针对真正想要的效果去调、去训练、去约束模子。。。 。。领域知识往往不在通用训练数据里。。。 。。这些能力是从笔直或功效的土壤里长出来的, ,,在流程的要害时刻被喂给模子。。。 。。当 11x 的署理在电话上评估一个 inbound 线索时, ,,它需要被训练去明确“什么是针对这个特定行业、这个特定人群的好销售对话”。。。 。。这是应用公司才华做的事情, ,,并且会一直积累。。。 。。

更主要的是, ,,营业在演进, ,,这些手艺会一直过时, ,,你的能力就是一连演进这些事情流和上下文, ,,这自己就酿成了竞争优势。。。 。。11x 的规模;;;;始外拓产品刚起步时, ,,“AI 味”的邮件刚最先进入人们的视野。。。 。。到今天, ,,人们对哪些是 AI 写的、哪些是人类写的已经有了敏锐的判断力, ,,而这个判断标准每隔几个月就在变。。。 。。署理必需一直凭证市场动态调解, ,,而护城河正是在这里被建出来的。。。 。。事实上, ,,只管保存这种转变, ,,11x 的正面回复率在已往几个月上升了 4 倍, ,,已经为客户创立了数亿美元的管道。。。 。。

在重漂后高的问题上事情。。。 。。 重大问题才是真正释放商业价值的地方, ,,否则你只会发明自己搭了一层薄薄的壳。。。 。。拆解任何一个足够重大的商业问题, ,,杂乱会迅速浮现。。。 。。举个听起来很简朴的 GTM 场景的例子:若是一家公司已经是你的客户, ,,你就不应该再联系这家公司里的任何联系人。。。 。。但这事一点都不简朴。。。 。。也许 CRM 里关联的是这家公司的一个域名。。。 。。那些有几十个子公司的集团怎么办??若是 CRM 纪录里留的是母公司域名怎么办??若是一个 Salesforce 里过时的匹配字段, ,,把一封冷销售邮件发给了一位现有客户的 CRO??真实天下的数据是脏的, ,,人类尚且搞未必, ,,模子也不会自动跨过这道坎。。。 。。从杂乱中提取秩序, ,,需要的是为问题详细形态而设计的专用署理, ,,而不是一个对着 CRM 指指点点的通用副驾驶。。。 。。事实上, ,,凭证 11x 的数据, ,,他们已经发明自己的数据质量和新鲜度远高于客户, ,,以是他们默认以自己的数据为准。。。 。。

护栏不但用来防止坏事爆发。。。 。。这是客户付钱给你的原因。。。 。。 护栏被严重低估了。。。 。。纵然在统一个产品内部, ,,每一个场景都需要自己的护栏。。。 。。一个受到严酷羁系的金融服务客户, ,,和一家中等规模的 SaaS 客户, ,,要求的包管完全差别, ,,这些差别一直渗透到署理怎么写、能联系谁、能触碰哪些数据、电话里能说什么、以及每个决议怎么被纪录。。。 。。一套“放之四海皆准”的系统在这种差别眼前会瓦解。。。 。。;;;;だ副匦璋闯【肮菇ā纯突柚谩⒁涣蠹, ,,而这项事情完全属于应用公司。。。 。。这就是 11x 有前置安排工程师和手艺安排战略师的原因, ,,他们需要为每一个客户的需求做定制。。。 。。举个例子, ,,他们曾与一家 F1000 企业相助, ,,通过语音向他们的大宗中小企业客户做授权外呼。。。 。。最初一再迭代接听率很低, ,,他们必需快速迭代, ,,学会怎么让这个特定人群在前 10 秒内爆发互动。。。 。。中小企业主的行为和大企业买家、通俗消耗者完全差别。。。 。。现在他们一天为这个客户创立的销售时机, ,,比他们整个销售团队针对这个细分市场一个月做的还多。。。 。。

包管的例子:智能不在模子里, ,,在事情流里

包管是另一个切面, ,,统一个结论。。。 。。FurtherAI 的 CEO Aman Gour 是这样明确这件事的:

当他们最先在真实包管运营中安排 AI 时, ,,重复听到一种假设:模子是智能的载体, ,,事情流只是围绕它的脚手架。。。 。。随着相助了越来越多的包管公司, ,,他们越来越确信这个假设是反的。。。 。。

在包管业, ,,许多智能自己就保存在事情流里。。。 。。两家包管公司可能走统一条路径处理一份投保申请:接件、审核、报价、承保。。。 。。但路径只是最容易的部分。。。 。。真正区分两家公司的是路径内部的所有细节:哪些风险需要上报、哪些损失约号值得关注、两条规则冲突时哪一条优先级更高、什么情形下必需有人签字、哪些外部数据会被调取、最终决议怎么归档。。。 。。这些逻辑不在一个清洁的规则引擎里, ,,而是散落在 SOP、司理审核纪录、核保理念、公司特定的风险偏好和多年的操作履历中。。。 。。其中很大一部分基础没有被写下来, ,,模子无法直接读取。。。 。。

这就是为什么 FurtherAI 不相信一个每次都从零推理的纯署理, ,,也不相信一个现实一乱就瓦解的硬编码事情流。。。 。。他们在构建的是署理式事情流, ,,事情流给你可重复性、可审计性和本钱控制, ,,署理处理不确定性并在主线走欠亨时恢复路径, ,,人类留在循环里处理那些需要肩负责任的判断。。。 。。

在第一天, ,,这能自动化人工操作。。。 。。但假以时日, ,,每一次上报酿成信号, ,,每一次破例是一次反馈, ,,每一次人类修正展示了操作手册那里不完整。。。 。。逐步地, ,,事情流不再是剧本, ,,而是酿成了包管公司的运营影象。。。 。。实验室很难触抵达这个层面。。。 。。他们会一连宣布更好的模子和更好的通用署理, ,,他们也理应云云。。。 。。但他们不会坐在一家包管公司的生产流程里足够久, ,,去明确为什么某一个账户被上报、某一个风险被拒保、某一位核保人推翻风险偏好指引并且他推翻得对。。。 。。这种明确, ,,只能来自把事情流跑在生产中数千次。。。 。。你第一天交付的事情流不是护城河。。。 。。生产使用所爆发的反馈循环, ,,随着时间积累, ,,才是。。。 。。

三个测试判断你的偏向, ,,两条路都有赢家

工具与步数测试。。。 。。 完成这项事情需要几多步??你需要构建的工具重大到什么水平??比照一下:水平化 AI 搜 Google Drive, ,,一步, ,,操作一个工具, ,,效果错了用户可以重搜;;;;;和一份针对律所三年先例的多步执法红线审查, ,,几十步、跨多个工具、输出必需通过合资人审核且最终可能在法庭上被辩说。。。 。。两者看起来都像“署理在做事情”, ,,但只有后者需要一个专注团队花几年才华构建的那种深度软件。。。 。。

系统测试。。。 。。 你在构建的是客户用来完成事情的“系统”, ,,照旧叠加在客户已有系统之上的“工具”??系统拥有端到端的事情流, ,,数据收罗、治理、完成事项的纪录, ,,是客户形貌现实事情怎样爆发时指向的工具。。。 。。工具只是在客户已经在运行的事情流上加一层智能。。。 。。做工具能爆发真实收入, ,,并且实验室可以拿走, ,,由于客户并不依赖你作为编排层。。。 。。高客单价通常是系统的信号, ,,由于系统替换真正的人力岗位并据此定价, ,,但这不是包管。。。 。。问自己一个问题:若是实验室宣布了一款据称与你直接竞争的产品, ,,客户还需要你的产品吗??若是谜底是“是”, ,,你在构建系统。。。 。。若是“否”, ,,你只是工具, ,,纵然你的客单价很高。。。 。。

对冲基金/P&L 测试。。。 。。 实验室的体现用 benchmark 来评判, ,,奥兹国其余地区的体现用客户的 P&L 来评判。。。 。。你的客户不体贴你的模子在 SWE-Bench 或 MMLU 上拿了几多分, ,,他们只体贴你的署理有没有搞定那笔生意、有没有把条约条款审对、有没有签下准确的保单。。。 。。若是他们死死盯着营业流的效果, ,,而不是一个通用的能力评分, ,,你就在奥兹国其余地区。。。 。。若是他们买的是通用能力, ,,你卖的工具他们买一张 Claude 或 Codex 的席位就能获得。。。 。。最好的署理公司需要像对冲基金一样运作, ,,用客户 P&L 权衡的 alpha 来取胜, ,,而不是用 benchmark 分数。。。 。。

我们会在黄砖路上和路之外同时看到重大的赢家。。。 。。

模子公司会继续赢, ,,由于他们拥有模子, ,,也拥有他们设计的水平工具的分发能力。。。 。。奥兹国其余地区的公司若是能拥有“事情系统”, ,,公司现实执行事情的界面, ,,以及从事情中爆发并沉淀下来的数据, ,,就能赢。。。 。。这些公司拥有数据收罗、事情盛行动系统和治理层。。。 。。随着某个笔直领域内更重大的事情流一直成熟, ,,它们会汇聚成一个客户最终依赖的焦点体验。。。 。。当新一代模子从既有至公司和新兴玩家中一直宣布, ,,这些公司就成了整合一切、把智能交付给客户的中心层。。。 。。模子在底层可以替换, ,,但事情系统不可。。。 。。

下一代企业软件, ,,会在黄砖路之外被建出来。。。 。。

点个“爱心”, ,,再走 吧

 

文章点评

未盘问到任何数据!

揭晓谈论

◎接待加入讨论, ,,请在这里揭晓您的看法、交流您的看法。。。 。。

最新文章

热门文章

随机推荐

【网站地图】