凯时AG

环球热门新闻资讯
2026-06-15 16:12:38
首页 > 新闻 > 时政要闻 > 正文

汤道生对谈姚顺雨:腾讯AI下半场10个要害思索

文 | 深流研究所,,, ,,,作者 | 绛枫

6月5日,,, ,,,在2026腾讯云AI工业应用大会上,,, ,,,腾讯集团高级执行副总裁、云与智慧工业事业群CEO汤道生,,, ,,,与腾讯首席AI科学家姚顺雨坐在一起,,, ,,,举行了一场关于腾讯AI的对谈。。。。。

这场对谈,,, ,,,爆发在一个颇有意味的时间点:

一方面,,, ,,,外界仍在追问"腾讯AI是不是慢了""腾讯对AI的投入够不敷";;;另一方面,,, ,,,腾讯AI正在显着加速——"龙虾"系列产品推出,,, ,,,混元Hy3 preview登顶全球挪用榜,,, ,,,WorkBuddy快速增添,,, ,,,模子、产品和工业落地最先形成更麋集的联动。。。。。

正是在这种反差中,,, ,,,外界对腾讯AI的判断,,, ,,,与腾讯AI的现实希望之间,,, ,,,形成了一种玄妙的认知错位。。。。。

这场不到一小时的对谈,,, ,,,恰恰提供了一个视察窗口。。。。。它少有地把腾讯对AI的战略判断、组织要领和落地路径,,, ,,,放在统一场对话中睁开:

从怎样明确AI下半场,,, ,,,到模子、产品与场景之间的关系,,, ,,,再到真实问题、Context、Agent、工程系统和组织能力怎样被纳入统一套框架。。。。。

若是说已往一年,,, ,,,行业更体贴腾讯AI"做了什么",,, ,,,那么这场对谈更值得关注的,,, ,,,是腾讯怎样明确AI、组织AI,,, ,,,并把AI推向真实场景。。。。。

从这场对话中,,, ,,,我们可以提炼出腾讯AI下半场的10个要害思索:

1、从"寻找要领"到"寻找问题",,, ,,,AI竞争的重心正在转移

"AI下半场",,, ,,,这个看法出自姚顺雨去年揭晓、并引发普遍讨论的一篇博客文章。。。。。

彼时,,, ,,,姚顺雨试图用这个词概括AI生长阶段的转变。。。。。今天这场对谈中,,, ,,,他对这个看法做了进一步诠释和延展。。。。。

在姚顺雨看来,,, ,,,很长一段时间里,,, ,,,AI最主要的使命是寻找研究要领。。。。。为翻译做一个翻译模子,,, ,,,为围棋做一个围棋模子,,, ,,,为特定使命设计特定系统。。。。。这个阶段,,, ,,,要领自己就是稀缺品。。。。。

但预训练和后训练改变了这一点。。。。。大模子最先变得像一个"万能锤子",,, ,,,具备了相对通用的解决问题能力。。。。。AI的突破点不再只是"有没有要领",,, ,,,而酿成了"什么问题值得被解决"。。。。。

这意味着,,, ,,,AI工业的主战场正在履历一次重心迁徙:当通用要领逐渐成熟,,, ,,,真正稀缺的工具就不再只是模子训练技巧,,, ,,,而是对真实问题的识别、界说和一连解决能力。。。。。

谁拥有高频、重大、真实的问题,,, ,,,谁就更可能训练出有用的AI;;;谁更能明确问题背后的用户需求、营业流程和本钱结构,,, ,,,谁就更可能把AI酿成产品,,, ,,,而不但是演示。。。。。

这也是姚顺雨诠释自己为什么选择加入腾讯时重复强调的一点——腾讯有大宗产品,,, ,,,也有大宗真实问题;;;更主要的是,,, ,,,这些产品组成了模子可以行动的情形。。。。。

2、Context成为新护城河,,, ,,,场景明确正在重塑AI壁垒

若是说"寻找问题"回覆的是AI应该去那里爆发价值,,, ,,,那么"Context"回覆的则是模子怎样在详细场景中真正明确用户。。。。。

姚顺雨在对谈中多次提到Context。。。。。他的判断是,,, ,,,模子越来越善于把重大输入酿成输出,,, ,,,但条件是它能拿到足够好的输入。。。。。

关于个人用户,,, ,,,这些输入可能是偏好、习惯、历史行为;;;关于企业用户,,, ,,,则可能是客户信息、营业流程、组织知识、权限系统、历史项目和系统数据。。。。。

没有这些上下文,,, ,,,模子再强,,, ,,,也只能给出泛化谜底;;;有了这些上下文,,, ,,,模子才可能真正明确"你是谁""你正在做什么""什么谜底对你有价值"。。。。。

这意味着,,, ,,,未来AI竞争不会只爆发在模子参数和推理速率上,,, ,,,也会爆发在Context的组织能力上。。。。。对腾讯而言,,, ,,,元宝、企业微信、腾讯聚会、腾讯文档、代码工具、云服务等入口,,, ,,,若是能成为大模子明确用户和营业的上下文泉源,,, ,,,就会形成一种差别于模子能力自己的竞争优势。。。。。

但Context不是简朴把数据塞给模子。。。。。什么信息该给,,, ,,,什么信息不应给,,, ,,,怎样控制权限,,, ,,,怎样包管数据清静和用户隐私,,, ,,,怎样阻止噪声滋扰,,, ,,,都是工程问题,,, ,,,也是产品问题。。。。。Context看似是数据资产,,, ,,,实质上却是产品能力、工程能力和组织协同能力的综合体现。。。。。

3、Co-Design不但是协作流程,,, ,,,更是模子与产品的共生关系

当模子要进入真实场景,,, ,,,仅仅把模子接入产品已经不敷了。。。。。

AI产品的效果往往是开放的、动态的、难以穷举的,,, ,,,使得模子团队和产品团队必需在更早阶段、更深条理上配合界说问题。。。。。这正是汤道生和姚顺雨重复谈到Co-Design的原因。。。。。

在古板软件时代,,, ,,,产品和手艺之间通常是线性关系:产品界说需求,,, ,,,研发实现功效,,, ,,,测试验证效果。。。。。但AI产品不是这样。。。。。模子能力会影响产品界线,,, ,,,产品数据会反过来影响模子训练,,, ,,,用户反馈又会改变评估系统。。。。。AI产品研发更像一个闭环系统,,, ,,,而不是瀑布流程。。。。。

姚顺雨提到,,, ,,,预训练更偏底层和通用,,, ,,,目的是把基础能力做扎实;;;但进入后训练阶段,,, ,,,问题就会更贴近产品:模子应该奖励什么、处分什么,,, ,,,什么回覆算好,,, ,,,什么行为算差,,, ,,,都需要来自真实应用的反馈和评估。。。。。

汤道生则从产品体验角度增补,,, ,,,在AI产品里,,, ,,,"好体验"并不是一个自然清晰的标准。。。。。数据怎么标注、颗粒度怎么定、哪些行为该奖励或处分,,, ,,,若是不可和产品目的对齐,,, ,,,最终产品行为就可能偏离预期。。。。。

这正是Co-Design的焦点:不但是模子团队"支持"产品团队,,, ,,,也不是产品团队"挪用"模子能力,,, ,,,而是双方配合界说什么是"好"效果。。。。。

也因此,,, ,,,姚顺雨特殊强调Trust(互信)。。。。。Co-Design最难的部分并不是手艺接口,,, ,,,而是模子团队和产品团队之间能否建设信任,,, ,,,能否换位思索,,, ,,,能否认可相互目的既有一致性,,, ,,,也有差别性。。。。。

4、从刷榜到真实天下的评估,,, ,,,AI评测正在被重新界说

大模子行业一经高度依赖Benchmark。。。。。一个模子能否进入讨论,,, ,,,往往取决于它在若干果真榜单上的分数。。。。。

姚顺雨在对谈中对这一点坚持了榨取。。。。。他并不否认Benchmark的价值,,, ,,,却也强调榜单问题和真适用户问题之间保存重大差别。。。。。

榜单里的问题通常形貌清晰、信息完整、界线明确;;;真实场景中的问题往往模糊、多轮、带有隐含上下文。。。。。用户可能只问一句"帮我看看这个方案行不可",,, ,,,模子却需要明确文件、历史讨论、公司气概、目的客户和决议标准。。。。。

这类能力很难通过古板榜单完整体现。。。。。

因此,,, ,,,对真实天下的评估最先变得越来越主要。。。。。它不但能发明模子的底线问题,,, ,,,也能资助研发团队明确真实Prompt漫衍,,, ,,,甚至反过来启发新的能力偏向。。。。。

Hy3 preview的宣布也体现了这种思绪。。。。。姚顺雨提到,,, ,,,先发Preview版本模子的主要目的之一,,, ,,,就是获得真实天下反馈,,, ,,,修复榜单中没有袒露出来的问题。。。。。相比只看果真Benchmark,,, ,,,来自元宝等产品的真实交互可以让团队相识用户需求,,, ,,,明确优化偏向。。。。。

这也意味着,,, ,,,模子研发不再只是围绕外部榜单优化,,, ,,,而是要基于真实营业场景自建评估系统。。。。。哪些能力对搜索主要,,, ,,,哪些能力对谈天主要,,, ,,,哪些能力对办公协作主要,,, ,,,哪些能力对Coding Agent主要,,, ,,,都需要在详细产品里被拆解、评估和回流。。。。。

5、从功效菜单到意图入口,,, ,,,AI产品开发范式正在改变

若是说模子和评估决议了AI产品的能力底座,,, ,,,那么用户交互方式的转变,,, ,,,则正在改写产品自己的形态。。。。。

汤道生用了一个很形象的比喻:古板产品像"预制菜",,, ,,,用户只能在菜单里点;;;AI产品则更开放,,, ,,,用户用自然语言提出需求,,, ,,,产品事先并不知道用户会问什么。。。。。

这背后是产品开发范式的转变。。。。。

在PC互联网和移动互联网时代,,, ,,,产品司理的焦点事情是设计功效、路径和界面。。。。。用户通过按钮、菜单、页面完成操作。。。。。产品设计的目的,,, ,,,是让功效尽可能清晰、流程尽可能顺畅。。。。。

AI时代,,, ,,,用户不再只是点击功效,,, ,,,而是在表达意图。。。。。产品要明确这个意图,,, ,,,拆解使命,,, ,,,挪用工具,,, ,,,使用上下文,,, ,,,并天生效果。。。。。

这就要求产品司理从"功效设计"转向"智能行为设计"。。。。。

一个AI产品不但要回覆能做什么,,, ,,,还要回覆:什么时间追问,,, ,,,什么时间拒绝,,, ,,,什么时间挪用工具,,, ,,,什么时间引用资料,,, ,,,什么时间给出不确定性提醒,,, ,,,什么语气切适用户预期。。。。。

这也是AI产品研发更难的地方。。。。。

古板产品的界线由功效决议,,, ,,,AI产品的界线由模子能力、工具系统、上下文质量、权限控制和评测系统配合决议。。。。。它不是把一个谈天框放到产品里,,, ,,,而是要重构产品和用户之间的关系。。。。。

6、Coding Agent不但是垂类工具,,, ,,,更是Agent能力的试验场

姚顺雨是ReAct框架的提出者,,, ,,,其博士研究也恒久围绕语言智能体睁开。。。。。他在对谈中回首了自己从GPT-2时代最先思索Agent的历程:

怎样把一个只会展望下一个Token的机械,,, ,,,酿成可以与外部情形交互、挪用工具、完成使命的Agent。。。。。

今天,,, ,,,这条线索最典范的落地之一就是Coding Agent。。。。。

姚顺雨以为,,, ,,,Coding Agent之以是主要,,, ,,,不但是由于软件开发市场大,,, ,,,而是由于其在能力结构上很是实质。。。。。当模子可以控制文件系统、挪用工具、运行代码、视察过失、修改方案时,,, ,,,它现实上进入了一个相对完整的使命情形。。。。。

这让Coding Agent成为训练和验证通用Agent能力的试验场。。。。。

它需要模子具备长程妄想、工具挪用、过失修复、多轮推理、上下文治理、效果验证等能力。。。。。这些能力一旦成熟,,, ,,,就不但服务于程序员,,, ,,,也会迁徙到办公、科研、企业流程、数据剖析、营业运营等更多场景。。。。。

这也诠释了为什么对谈中多次提到腾讯的两款产品——CodeBuddy和WorkBuddy。。。。。前者面向开发者,,, ,,,后者面向办公人群,,, ,,,但二者背后的能力演进偏向是一致的:让模子从"回覆问题"走向"完成使命"。。。。。

Agent的真正价值不在于它像人一样谈天,,, ,,,而在于它能在真真相形中闭环。。。。。

7、Token焦虑的误区:不可只看单价,,, ,,,要看使命闭环本钱

随着Agent最先执行重大使命,,, ,,,Token消耗迅速上升。。。。。用户和企业都最先关注积分、挪用量和推理本钱。。。。。

在姚顺雨看来,,, ,,,Token的性价比首先取决于能力体现。。。。。一个更强的模子若是能一次把使命做对,,, ,,,可能比自制但重复失败的模子更省钱。。。。。

这句话把Token本钱从"单价问题"拉回到"使命问题"。。。。。

关于企业来说,,, ,,,真正应该盘算的不是每百万Token几多钱,,, ,,,而是完成一次可靠营业闭环的总本钱。。。。。这内里包括模子挪用本钱,,, ,,,也包括人工修正本钱、失败重试本钱、期待时间本钱和营业风险本钱。。。。。

若是一个模子自制但经常蜕化,,, ,,,最终可能并不自制。。。。。若是一个模子贵但能稳固完成要害使命,,, ,,,反而可能是更高性价比的选择。。。。。

虽然,,, ,,,这并不料味着本钱不主要。。。。。姚顺雨也提到,,, ,,,中国团队在本钱优化上有优势,,, ,,,包括用更小模子做好高价值使命、架构立异、长文治理、Agent脚手架等。。。。。

这些优化都建设在一个条件上:模子要先足够可靠。。。。。AI下半场的本钱竞争,,, ,,,可能不是简朴的价钱战,,, ,,,而是围绕"稳固完成使命"睁开的系统效率竞争。。。。。

8、AI原生产品需要新组织:小团队、高试验、low ego文化

谈到腾讯WorkBuddy的产品团队时,,, ,,,汤道生提到了一个细节:组织很是扁平,,, ,,,许多三五人的小团队围绕详细领域攻坚,,, ,,,大宗试验,,, ,,,快速验证,,, ,,,也要容忍试错。。。。。

这与古板互联网产品研发有显着差别。。。。。古板产品通常依赖较成熟的流程:需求评审、设计研发、测试上线、一连迭代。。。。。AI原生产品的不确定性更强,,, ,,,模子能力和用户行为都在快速转变,,, ,,,许多偏向只有试了才知道是否有用。。。。。

与此同时,,, ,,,工程师角色也在转变。。。。。当越来越多代码可以由AI天生,,, ,,,工程师的焦点价值不再只是亲自写代码,,, ,,,而是明确需求、设计架构、拆解使命、驱动多个Coding Agent,,, ,,,并加入评测和质量包管。。。。。汤道生甚至提到,,, ,,,每个工程师都更像一个有想法的leader。。。。。

这意味着,,, ,,,AI时代的产品团队会泛起更强的角色融合:产品司理需要明确模子界线,,, ,,,工程师需要具备产品判断,,, ,,,测试需要前置到评估设计,,, ,,,算法团队也需要明确用户体验。。。。。组织不再只是职能分工,,, ,,,而要围绕使命闭环重新组合。。。。。

但AI组织的转变,,, ,,,不但是团队变小、试验变快。。。。。姚顺雨提到,,, ,,,他选择加入腾讯的要害因素之一是这里的文化:更重视信任和真诚,,, ,,,不但围绕短期指标运转;;;团队也有low ego(低自我)、务实和扎实的一面。。。。。

这些看起来不像详细手艺能力,,, ,,,却是AI组织主要的底层条件。。。。。由于AI研发和产品落地都充满不确定性,,, ,,,模子训练、产品Co-Design、真实天下评估、Agent试错,,, ,,,都需要跨团队互信,,, ,,,也需要忠实面临失败反馈。。。。。

在姚顺雨看来,,, ,,,一个恒久面向AGI的AI组织,,, ,,,应该是一个平衡的"三角形":一是基础能力,,, ,,,把预训练和后训练做扎实;;;二是产品能力,,, ,,,把手艺真正转化为用户和社会价值;;;三是前沿探索,,, ,,,一连寻找新的研究范式和时机。。。。。

9、腾讯AI"慢了"么???一场多元的比拼才刚最先

这场对谈也回应了外界关于"腾讯AI是不是慢了"的质疑。。。。。

姚顺雨把问题拆成两个判断:AI究竟是短期游戏照旧恒久游戏???未来是简单主线照旧多元竞争???

在硅谷,,, ,,,已往一段时间有一种情绪很强烈:AI会在一两年内取代大宗事情,,, ,,,所有人都要抓紧在短时间内完成结构。。。。。但姚顺雨并不认同这种判断。。。。。在他看来,,, ,,,AI不是一场已经靠近终局的短跑,,, ,,,而更像是刚刚最先的长周期厘革。。。。。

他提到,,, ,,,ChatGPT和Claude Code不应该、也不会是唯一的超等应用。。。。。更可能的情形是,,, ,,,AI像上世纪70年月PC刚刚泛起时一样,,, ,,,真正的产品形态、商业时机和使用方式,,, ,,,都还远没有被充分发明出来。。。。。

已往几年,,, ,,,行业看起来有一条相对清晰的手艺路径:预训练、后训练、Agent、Coding Agent。。。。。所有人都在沿着类似偏向追赶。。。。。但姚顺雨以为,,, ,,,未来不会只剩下一条主线,,, ,,,而是多元生长。。。。。

Coding Agent虽然会越来越主要,,, ,,,但它仍然只是最先。。。。。多模态、具身智能、企业Agent、办公协作、行业应用,,, ,,,尚有大宗场景尚未被真正填满。。。。。

因此,,, ,,,"腾讯AI是不是慢了"这个问题,,, ,,,不可只用某个时间点、某一个产品或某一次宣布来判断。。。。。

更要害的问题是:腾讯能否忠实面临反馈,,, ,,,能否在重大组织中快速调解,,, ,,,能否把用户反馈酿成模子刷新,,, ,,,把产品履历酿成评估系统,,, ,,,把工程能力酿成可复用平台,,, ,,,把多营业场景酿成Context网络。。。。。

姚顺雨在对谈中提到,,, ,,,已往模子和产品都做了许多探索,,, ,,,也走了不少弯路。。。。。这并不料外。。。。。真正主要的是"能不可Be Real,,, ,,,能不可看到反馈后改变,,, ,,,能不可坚持耐心"。。。。。

这可能也是腾讯AI下半场最焦点的命题:怎样在一个恒久、多元、仍在快速转变的AI周期里,,, ,,,把重大场景和恒久主义转化为一连迭代的速率。。。。。

10、腾讯的AI路径:场景、工程与模子的系统性协同

对腾讯这样一家营业重大、产品众多的公司来说,,, ,,,AI战略的难点不但是做出一个强模子,,, ,,,推出多个AI应用,,, ,,,而是怎样让疏散的场景、工程能力和模子研发相互联动,,, ,,,形成一连迭代的系统能力。。。。。

汤道生总结了腾讯AI的三个焦点能力:场景联接、工程驾驭、模子驱动。。。。。这三个词,,, ,,,现实上也对应了AI从手艺演示走向工业落地的三个要害环节。。。。。

第一是场景联接。。。。。通过微信、企业微信、元宝等高频触点,,, ,,,把大模子嵌入真实营业流。。。。。这对应的是腾讯恒久积累的用户场景和企业毗连能力。。。。。AI只有进入真实营业流,,, ,,,才会爆发真实反馈,,, ,,,也才有时机被一直刷新。。。。。

第二是工程驾驭。。。。。通过Harness系统、AI Infra、Agent Runtime、高速网络、高吞吐存储和GPU使用率优化,,, ,,,让Agent稳固、可信、可一连运行。。。。。这对应的是AI从Demo走向生产情形时必需解决的工程问题。。。。。对企业客户来说,,, ,,,一个Agent能不可用,,, ,,,不但取决于它是否智慧,,, ,,,也取决于它是否稳固、清静、可控、可一连。。。。。

第三是模子驱动。。。。。依托混元大模子,,, ,,,以及模子和产品的Co-Design,,, ,,,在适用性、性价比和ROI之间寻找平衡。。。。。模子不是伶仃保存的能力,,, ,,,而要在产品反馈中一连演进,,, ,,,在工程系统中被稳固释放。。。。。

AI竞争不但是简单模子竞赛,,, ,,,而是模子、产品、工程、场景、生态配相助用的复合竞争。。。。。

腾讯不是一个只有简单AI产品的公司,,, ,,,而是一个拥有重大营业、多场景、多组织形态的公司。。。。。重大性可能会让公司的行动变慢,,, ,,,但另一方面也提供了大宗真实问题和Context。。。。。能否把重大性转化为系统化优势,,, ,,,是腾讯AI下半场的要害。。。。。

“已往谈美白,,, ,,,大致有三个境界,,, ,,,提亮、美白、祛斑。。。。。现在,,, ,,,林清轩美白英华油实现细胞级美白,,, ,,,重新界说了美白。。。。。”林清轩首创人孙来春在美博会现场的美白英华油宣布会上先容,,, ,,,林清轩用“细胞级以油养白”,,, ,,,开创了美白护肤的新境界。。。。。

责任编辑:何嘉惠

【网站地图】