凯时AG

泉源:学校辟谣“女先生台下给校长打伞”作者: 林思生:

汤道生对谈姚顺雨:腾讯AI下半场10个要害思索

文 | 深流研究所,, ,,作者 | 绛枫

6月5日,, ,,在2026腾讯云AI工业应用大会上,, ,,腾讯集团高级执行副总裁、云与智慧工业事业群CEO汤道生,, ,,与腾讯首席AI科学家姚顺雨坐在一起,, ,,举行了一场关于腾讯AI的对谈。。。

这场对谈,, ,,爆发在一个颇有意味的时间点:

一方面,, ,,外界仍在追问"腾讯AI是不是慢了""腾讯对AI的投入够不敷";;另一方面,, ,,腾讯AI正在显着加速——"龙虾"系列产品推出,, ,,混元Hy3 preview登顶全球挪用榜,, ,,WorkBuddy快速增添,, ,,模子、产品和工业落地最先形成更麋集的联动。。。

正是在这种反差中,, ,,外界对腾讯AI的判断,, ,,与腾讯AI的现实希望之间,, ,,形成了一种玄妙的认知错位。。。

这场不到一小时的对谈,, ,,恰恰提供了一个视察窗口。。。它少有地把腾讯对AI的战略判断、组织要领和落地路径,, ,,放在统一场对话中睁开:

从怎样明确AI下半。。。, ,,到模子、产品与场景之间的关系,, ,,再到真实问题、Context、Agent、工程系统和组织能力怎样被纳入统一套框架。。。

若是说已往一年,, ,,行业更体贴腾讯AI"做了什么",, ,,那么这场对谈更值得关注的,, ,,是腾讯怎样明确AI、组织AI,, ,,并把AI推向真实场景。。。

从这场对话中,, ,,我们可以提炼出腾讯AI下半场的10个要害思索:

1、从"寻找要领"到"寻找问题",, ,,AI竞争的重心正在转移

"AI下半场",, ,,这个看法出自姚顺雨去年揭晓、并引发普遍讨论的一篇博客文章。。。

彼时,, ,,姚顺雨试图用这个词概括AI生长阶段的转变。。。今天这场对谈中,, ,,他对这个看法做了进一步诠释和延展。。。

在姚顺雨看来,, ,,很长一段时间里,, ,,AI最主要的使命是寻找研究要领。。。为翻译做一个翻译模子,, ,,为围棋做一个围棋模子,, ,,为特定使命设计特定系统。。。这个阶段,, ,,要领自己就是稀缺品。。。

但预训练和后训练改变了这一点。。。大模子最先变得像一个"万能锤子",, ,,具备了相对通用的解决问题能力。。。AI的突破点不再只是"有没有要领",, ,,而酿成了"什么问题值得被解决"。。。

这意味着,, ,,AI工业的主战场正在履历一次重心迁徙:当通用要领逐渐成熟,, ,,真正稀缺的工具就不再只是模子训练技巧,, ,,而是对真实问题的识别、界说和一连解决能力。。。

谁拥有高频、重大、真实的问题,, ,,谁就更可能训练出有用的AI;;谁更能明确问题背后的用户需求、营业流程和本钱结构,, ,,谁就更可能把AI酿成产品,, ,,而不但是演示。。。

这也是姚顺雨诠释自己为什么选择加入腾讯时重复强调的一点——腾讯有大宗产品,, ,,也有大宗真实问题;;更主要的是,, ,,这些产品组成了模子可以行动的情形。。。

2、Context成为新护城河,, ,,场景明确正在重塑AI壁垒

若是说"寻找问题"回覆的是AI应该去那里爆发价值,, ,,那么"Context"回覆的则是模子怎样在详细场景中真正明确用户。。。

姚顺雨在对谈中多次提到Context。。。他的判断是,, ,,模子越来越善于把重大输入酿成输出,, ,,但条件是它能拿到足够好的输入。。。

关于个人用户,, ,,这些输入可能是偏好、习惯、历史行为;;关于企业用户,, ,,则可能是客户信息、营业流程、组织知识、权限系统、历史项目和系统数据。。。

没有这些上下文,, ,,模子再强,, ,,也只能给出泛化谜底;;有了这些上下文,, ,,模子才可能真正明确"你是谁""你正在做什么""什么谜底对你有价值"。。。

这意味着,, ,,未来AI竞争不会只爆发在模子参数和推理速率上,, ,,也会爆发在Context的组织能力上。。。对腾讯而言,, ,,元宝、企业微信、腾讯聚会、腾讯文档、代码工具、云服务等入口,, ,,若是能成为大模子明确用户和营业的上下文泉源,, ,,就会形成一种差别于模子能力自己的竞争优势。。。

但Context不是简朴把数据塞给模子。。。什么信息该给,, ,,什么信息不应给,, ,,怎样控制权限,, ,,怎样包管数据清静和用户隐私,, ,,怎样阻止噪声滋扰,, ,,都是工程问题,, ,,也是产品问题。。。Context看似是数据资产,, ,,实质上却是产品能力、工程能力和组织协同能力的综合体现。。。

3、Co-Design不但是协作流程,, ,,更是模子与产品的共生关系

当模子要进入真实场景,, ,,仅仅把模子接入产品已经不敷了。。。

AI产品的效果往往是开放的、动态的、难以穷举的,, ,,使得模子团队和产品团队必需在更早阶段、更深条理上配合界说问题。。。这正是汤道生和姚顺雨重复谈到Co-Design的原因。。。

在古板软件时代,, ,,产品和手艺之间通常是线性关系:产品界说需求,, ,,研发实现功效,, ,,测试验证效果。。。但AI产品不是这样。。。模子能力会影响产品界线,, ,,产品数据会反过来影响模子训练,, ,,用户反馈又会改变评估系统。。。AI产品研发更像一个闭环系统,, ,,而不是瀑布流程。。。

姚顺雨提到,, ,,预训练更偏底层和通用,, ,,目的是把基础能力做扎实;;但进入后训练阶段,, ,,问题就会更贴近产品:模子应该奖励什么、处分什么,, ,,什么回覆算好,, ,,什么行为算差,, ,,都需要来自真实应用的反馈和评估。。。

汤道生则从产品体验角度增补,, ,,在AI产品里,, ,,"好体验"并不是一个自然清晰的标准。。。数据怎么标注、颗粒度怎么定、哪些行为该奖励或处分,, ,,若是不可和产品目的对齐,, ,,最终产品行为就可能偏离预期。。。

这正是Co-Design的焦点:不但是模子团队"支持"产品团队,, ,,也不是产品团队"挪用"模子能力,, ,,而是双方配合界说什么是"好"效果。。。

也因此,, ,,姚顺雨特殊强调Trust(互信)。。。Co-Design最难的部分并不是手艺接口,, ,,而是模子团队和产品团队之间能否建设信任,, ,,能否换位思索,, ,,能否认可相互目的既有一致性,, ,,也有差别性。。。

4、从刷榜到真实天下的评估,, ,,AI评测正在被重新界说

大模子行业一经高度依赖Benchmark。。。一个模子能否进入讨论,, ,,往往取决于它在若干果真榜单上的分数。。。

姚顺雨在对谈中对这一点坚持了榨取。。。他并不否认Benchmark的价值,, ,,却也强调榜单问题和真适用户问题之间保存重大差别。。。

榜单里的问题通常形貌清晰、信息完整、界线明确;;真实场景中的问题往往模糊、多轮、带有隐含上下文。。。用户可能只问一句"帮我看看这个方案行不可",, ,,模子却需要明确文件、历史讨论、公司气概、目的客户和决议标准。。。

这类能力很难通过古板榜单完整体现。。。

因此,, ,,对真实天下的评估最先变得越来越主要。。。它不但能发明模子的底线问题,, ,,也能资助研发团队明确真实Prompt漫衍,, ,,甚至反过来启发新的能力偏向。。。

Hy3 preview的宣布也体现了这种思绪。。。姚顺雨提到,, ,,先发Preview版本模子的主要目的之一,, ,,就是获得真实天下反。。。, ,,修复榜单中没有袒露出来的问题。。。相比只看果真Benchmark,, ,,来自元宝等产品的真实交互可以让团队相识用户需求,, ,,明确优化偏向。。。

这也意味着,, ,,模子研发不再只是围绕外部榜单优化,, ,,而是要基于真实营业场景自建评估系统。。。哪些能力对搜索主要,, ,,哪些能力对谈天主要,, ,,哪些能力对办公协作主要,, ,,哪些能力对Coding Agent主要,, ,,都需要在详细产品里被拆解、评估和回流。。。

5、从功效菜单到意图入口,, ,,AI产品开发范式正在改变

若是说模子和评估决议了AI产品的能力底座,, ,,那么用户交互方式的转变,, ,,则正在改写产品自己的形态。。。

汤道生用了一个很形象的比喻:古板产品像"预制菜",, ,,用户只能在菜单里点;;AI产品则更开放,, ,,用户用自然语言提出需求,, ,,产品事先并不知道用户会问什么。。。

这背后是产品开发范式的转变。。。

在PC互联网和移动互联网时代,, ,,产品司理的焦点事情是设计功效、路径和界面。。。用户通过按钮、菜单、页面完成操作。。。产品设计的目的,, ,,是让功效尽可能清晰、流程尽可能顺畅。。。

AI时代,, ,,用户不再只是点击功效,, ,,而是在表达意图。。。产品要明确这个意图,, ,,拆解使命,, ,,挪用工具,, ,,使用上下文,, ,,并天生效果。。。

这就要求产品司理从"功效设计"转向"智能行为设计"。。。

一个AI产品不但要回覆能做什么,, ,,还要回覆:什么时间追问,, ,,什么时间拒绝,, ,,什么时间挪用工具,, ,,什么时间引用资料,, ,,什么时间给出不确定性提醒,, ,,什么语气切适用户预期。。。

这也是AI产品研发更难的地方。。。

古板产品的界线由功效决议,, ,,AI产品的界线由模子能力、工具系统、上下文质量、权限控制和评测系统配合决议。。。它不是把一个谈天框放到产品里,, ,,而是要重构产品和用户之间的关系。。。

6、Coding Agent不但是垂类工具,, ,,更是Agent能力的试验场

姚顺雨是ReAct框架的提出者,, ,,其博士研究也恒久围绕语言智能体睁开。。。他在对谈中回首了自己从GPT-2时代最先思索Agent的历程:

怎样把一个只会展望下一个Token的机械,, ,,酿成可以与外部情形交互、挪用工具、完成使命的Agent。。。

今天,, ,,这条线索最典范的落地之一就是Coding Agent。。。

姚顺雨以为,, ,,Coding Agent之以是主要,, ,,不但是由于软件开发市场大,, ,,而是由于其在能力结构上很是实质。。。当模子可以控制文件系统、挪用工具、运行代码、视察过失、修改方案时,, ,,它现实上进入了一个相对完整的使命情形。。。

这让Coding Agent成为训练和验证通用Agent能力的试验场。。。

它需要模子具备长程妄想、工具挪用、过失修复、多轮推理、上下文治理、效果验证等能力。。。这些能力一旦成熟,, ,,就不但服务于程序员,, ,,也会迁徙到办公、科研、企业流程、数据剖析、营业运营等更多场景。。。

这也诠释了为什么对谈中多次提到腾讯的两款产品——CodeBuddy和WorkBuddy。。。前者面向开发者,, ,,后者面向办公人群,, ,,但二者背后的能力演进偏向是一致的:让模子从"回覆问题"走向"完成使命"。。。

Agent的真正价值不在于它像人一样谈天,, ,,而在于它能在真真相形中闭环。。。

7、Token焦虑的误区:不可只看单价,, ,,要看使命闭环本钱

随着Agent最先执行重大使命,, ,,Token消耗迅速上升。。。用户和企业都最先关注积分、挪用量和推理本钱。。。

在姚顺雨看来,, ,,Token的性价比首先取决于能力体现。。。一个更强的模子若是能一次把使命做对,, ,,可能比自制但重复失败的模子更省钱。。。

这句话把Token本钱从"单价问题"拉回到"使命问题"。。。

关于企业来说,, ,,真正应该盘算的不是每百万Token几多钱,, ,,而是完成一次可靠营业闭环的总本钱。。。这内里包括模子挪用本钱,, ,,也包括人工修正本钱、失败重试本钱、期待时间本钱和营业风险本钱。。。

若是一个模子自制但经常蜕化,, ,,最终可能并不自制。。。若是一个模子贵但能稳固完成要害使命,, ,,反而可能是更高性价比的选择。。。

虽然,, ,,这并不料味着本钱不主要。。。姚顺雨也提到,, ,,中国团队在本钱优化上有优势,, ,,包括用更小模子做好高价值使命、架构立异、长文治理、Agent脚手架等。。。

这些优化都建设在一个条件上:模子要先足够可靠。。。AI下半场的本钱竞争,, ,,可能不是简朴的价钱战,, ,,而是围绕"稳固完成使命"睁开的系统效率竞争。。。

8、AI原生产品需要新组织:小团队、高试验、low ego文化

谈到腾讯WorkBuddy的产品团队时,, ,,汤道生提到了一个细节:组织很是扁平,, ,,许多三五人的小团队围绕详细领域攻坚,, ,,大宗试验,, ,,快速验证,, ,,也要容忍试错。。。

这与古板互联网产品研发有显着差别。。。古板产品通常依赖较成熟的流程:需求评审、设计研发、测试上线、一连迭代。。。AI原生产品的不确定性更强,, ,,模子能力和用户行为都在快速转变,, ,,许多偏向只有试了才知道是否有用。。。

与此同时,, ,,工程师角色也在转变。。。当越来越多代码可以由AI天生,, ,,工程师的焦点价值不再只是亲自写代码,, ,,而是明确需求、设计架构、拆解使命、驱动多个Coding Agent,, ,,并加入评测和质量包管。。。汤道生甚至提到,, ,,每个工程师都更像一个有想法的leader。。。

这意味着,, ,,AI时代的产品团队会泛起更强的角色融合:产品司理需要明确模子界线,, ,,工程师需要具备产品判断,, ,,测试需要前置到评估设计,, ,,算法团队也需要明确用户体验。。。组织不再只是职能分工,, ,,而要围绕使命闭环重新组合。。。

但AI组织的转变,, ,,不但是团队变小、试验变快。。。姚顺雨提到,, ,,他选择加入腾讯的要害因素之一是这里的文化:更重视信任和真诚,, ,,不但围绕短期指标运转;;团队也有low ego(低自我)、务实和扎实的一面。。。

这些看起来不像详细手艺能力,, ,,却是AI组织主要的底层条件。。。由于AI研发和产品落地都充满不确定性,, ,,模子训练、产品Co-Design、真实天下评估、Agent试错,, ,,都需要跨团队互信,, ,,也需要忠实面临失败反馈。。。

在姚顺雨看来,, ,,一个恒久面向AGI的AI组织,, ,,应该是一个平衡的"三角形":一是基础能力,, ,,把预训练和后训练做扎实;;二是产品能力,, ,,把手艺真正转化为用户和社会价值;;三是前沿探索,, ,,一连寻找新的研究范式和时机。。。

9、腾讯AI"慢了"么????一场多元的比拼才刚最先

这场对谈也回应了外界关于"腾讯AI是不是慢了"的质疑。。。

姚顺雨把问题拆成两个判断:AI究竟是短期游戏照旧恒久游戏????未来是简单主线照旧多元竞争????

在硅谷,, ,,已往一段时间有一种情绪很强烈:AI会在一两年内取代大宗事情,, ,,所有人都要抓紧在短时间内完成结构。。。但姚顺雨并不认同这种判断。。。在他看来,, ,,AI不是一场已经靠近终局的短跑,, ,,而更像是刚刚最先的长周期厘革。。。

他提到,, ,,ChatGPT和Claude Code不应该、也不会是唯一的超等应用。。。更可能的情形是,, ,,AI像上世纪70年月PC刚刚泛起时一样,, ,,真正的产品形态、商业时机和使用方式,, ,,都还远没有被充分发明出来。。。

已往几年,, ,,行业看起来有一条相对清晰的手艺路径:预训练、后训练、Agent、Coding Agent。。。所有人都在沿着类似偏向追赶。。。但姚顺雨以为,, ,,未来不会只剩下一条主线,, ,,而是多元生长。。。

Coding Agent虽然会越来越主要,, ,,但它仍然只是最先。。。多模态、具身智能、企业Agent、办公协作、行业应用,, ,,尚有大宗场景尚未被真正填满。。。

因此,, ,,"腾讯AI是不是慢了"这个问题,, ,,不可只用某个时间点、某一个产品或某一次宣布来判断。。。

更要害的问题是:腾讯能否忠实面临反。。。, ,,能否在重大组织中快速调解,, ,,能否把用户反馈酿成模子刷新,, ,,把产品履历酿成评估系统,, ,,把工程能力酿成可复用平台,, ,,把多营业场景酿成Context网络。。。

姚顺雨在对谈中提到,, ,,已往模子和产品都做了许多探索,, ,,也走了不少弯路。。。这并不料外。。。真正主要的是"能不可Be Real,, ,,能不可看到反馈后改变,, ,,能不可坚持耐心"。。。

这可能也是腾讯AI下半场最焦点的命题:怎样在一个恒久、多元、仍在快速转变的AI周期里,, ,,把重大场景和恒久主义转化为一连迭代的速率。。。

10、腾讯的AI路径:场景、工程与模子的系统性协同

对腾讯这样一家营业重大、产品众多的公司来说,, ,,AI战略的难点不但是做出一个强模子,, ,,推出多个AI应用,, ,,而是怎样让疏散的场景、工程能力和模子研发相互联动,, ,,形成一连迭代的系统能力。。。

汤道生总结了腾讯AI的三个焦点能力:场景联接、工程驾驭、模子驱动。。。这三个词,, ,,现实上也对应了AI从手艺演示走向工业落地的三个要害环节。。。

第一是场景联接。。。通过微信、企业微信、元宝等高频触点,, ,,把大模子嵌入真实营业流。。。这对应的是腾讯恒久积累的用户场景和企业毗连能力。。。AI只有进入真实营业流,, ,,才会爆发真实反。。。, ,,也才有时机被一直刷新。。。

第二是工程驾驭。。。通过Harness系统、AI Infra、Agent Runtime、高速网络、高吞吐存储和GPU使用率优化,, ,,让Agent稳固、可信、可一连运行。。。这对应的是AI从Demo走向生产情形时必需解决的工程问题。。。对企业客户来说,, ,,一个Agent能不可用,, ,,不但取决于它是否智慧,, ,,也取决于它是否稳固、清静、可控、可一连。。。

第三是模子驱动。。。依托混元大模子,, ,,以及模子和产品的Co-Design,, ,,在适用性、性价比和ROI之间寻找平衡。。。模子不是伶仃保存的能力,, ,,而要在产品反馈中一连演进,, ,,在工程系统中被稳固释放。。。

AI竞争不但是简单模子竞赛,, ,,而是模子、产品、工程、场景、生态配相助用的复合竞争。。。

腾讯不是一个只有简单AI产品的公司,, ,,而是一个拥有重大营业、多场景、多组织形态的公司。。。重大性可能会让公司的行动变慢,, ,,但另一方面也提供了大宗真实问题和Context。。。能否把重大性转化为系统化优势,, ,,是腾讯AI下半场的要害。。。

@陈姿茜:世界体育电竟,, ,,天下杯首次泛起VAR介入后黄牌易主
@姜景秋:日本U17球员赛后向国足全队鞠躬致意
@游信宏:博主:俄大面积收复被乌抨击夺回土地

热门排行

【网站地图】