凯时AG

Agent整体进化!腾讯谷歌们加码,,,AI打工人要普及了??????

作者:黄信春
宣布时间:2026-06-15 06:47:37
阅读量:19

Agent整体进化!腾讯谷歌们加码,,,AI打工人要普及了??????

最近我的 X 首页有点希奇,,,关于 Agent 的帖子显着变多了,,,但和以前那种「某某模子评测」纷歧样,,,各人似乎不再体贴这个模子答题答得有多好,,,更在意一件更现实的事,,,哪个 Agent 能帮我把手头这件事做完??????

在刚刚竣事的 5 月,,,「怪事」多了起来。。。。。5月20日,,,腾讯推出了叫「马维斯」(Marvis)的工具,,,官方定位是「操作系统层级 AI 助手」,,,Windows、macOS、安卓三端同步上线,,,内置 6 个 7×24 小时在线的专项 Agent,,,每个认真一块:文件、浏览器、应用、搜索、盘算机操控,,,装机即用。。。。。第二天,,,OpenAI 在 5 月 21 日宣布 ChatGPT 以 add-in 形式接进 Microsoft PowerPoint,,,免用度户和 Business 订阅者都能用,,,在 PowerPoint 里开个侧边栏,,,用自然语言天生或修改 PPT。。。。。

而在统一周,,,Google 在 I/O 2026 上推出了 Gemini Spark,,,一个可以 24 小时一连跑的个人 Agent,,,运行在 Google Cloud 专属虚拟机上,,,能读你的邮件、改你的文档、通过 Chrome 操作网页,,,你甚至不需要盯着它,,,这些活都醒目完。。。。。

(图源:雷科技制图)

这就不难明确为何风向转得云云之快了,,,在一大堆 AI 工具的轰炸之下,,,大都通俗人已经不那么在意一个新的大模子能答对几大都学题,,,反倒是对 Agent 醒目什么活更有兴趣。。。。。

把 Agent 变「牛马」,,,AI 要给打工人打工??????

先说 ChatGPT for PowerPoint,,,加了 add-in 之后,,,PowerPoint 右边会泛起一个 ChatGPT 侧边栏,,,告诉它「做一份面向投资人的产品演示,,,从上周 Outlook 里找项目希望」,,,它会拉数据、天生内容、排好版,,,全程不脱离 PowerPoint。。。。。能连 Gmail、Outlook、SharePoint,,,也就是说它在实验「帮你整合信息」,,,不但是「帮你天生」。。。。。

现适用下来,,,天生一份结构完整的初稿速率快,,,开会前暂时要一份 PPT 的场景基本够用。。。。。OpenAI 自己也坦诚,,,重大的模板处理和字体排版暂时还不支持。。。。。雷科技此前也专门针对这个插件做了详细的体验报告,,,感兴趣的朋侪可以点击查阅。。。。。

(图源:雷科技制图)

说着实的,,,像这类 AI 工具插件,,,并不有数,,,实质上它们照旧在一个专项的场景里提供资助,,,甚至现在还都不太成熟。。。。。但腾讯推出的马维斯纷歧样,,,它是一个网状式 Agent 智能体合集,,,一个主 Agent 在上面统筹使命,,,下面调理 File、Computer、App、Browser、Search 这些专项 Agent 并行执行,,,把系统、文件、应用、算力、跨端控制都纳进统一其中心层。。。。。你告诉它「帮我找上周 PM 发给我的谁人 Agent 架构图 PPT,,,文件名忘了,,,生涯在桌面」,,,它会扫文件内容、做语义明确,,,而不是在文件夹里按要害词搜索。。。。。

(图源:雷科技制图)

现实上手试了几个场景,,,好比最最先我们让它拉个复盘会需要准备的质料。。。。。马维斯的回覆先做会前准备表,,,再给 90 分钟议程,,,顺序切合现实事情流,,,还把会前行动拆成了可分配的使命:运营拉线索质量数据、产品汇总客户反馈、销售整理卖点问题,,,每项都有认真人和预期产出。。。。。它很智慧的点在于,,,会把「卖点不清晰」翻译成「整理客户原话和详细场景」,,,这很适用。。。。。

再好比把一份 Word 谋划简报和一张 Excel 明细表同时上传,,,让它找销售额、毛利、地区排名,,,以及有没有显着异常。。。。。它挪用了 File Agent,,,把两份文件跨表串联起来,,,给出了销售额 2,357,512、毛利 836,257、华南地区最高,,,还把重复客户电话、空认真人、零数目售后单、异常大单这几类问题都列出来了。。。。。

虽然,,,期待时间较量长照旧不太能忽视的。。。。。简朴的开场问答约莫要 30 秒,,,不是瞬时;; ;;;文件剖析的话,,,从提交到最终效果约莫 6 分钟,,,并且中心历程的颗粒度不敷细,,,你能看到 File Agent 在处理,,,但不知道它读到那里、还要多久。。。。。关于「我手上有质料、开会前想快速扫一遍」的场景,,,6 分钟照旧可以接受的。。。。。

(图源:雷科技制图)

不过呢,,,马维斯最近能乐成出圈,,,我以为照旧和他的设计有关。。。。。在侧边栏我们可以看到一个叫「办公室」的页面,,,翻开是一个白色 3D 办公室场景,,,Marvis、App Agent、Browser Agent 像几个员工坐在各自的工位上,,,右侧展示今日使命完成数、Token 消耗和举行中的使命。。。。。它用有趣的动画,,,直观地把 Agent 与 Agent 之间是怎样协作、怎样分配使命的历程展现出来,,,相比起死板乏味的工具,,,「AI 牛马」的形象太深入人心了。。。。。

不管深度怎样,,,从在 PowerPoint 里帮你一键出稿,,,到在整台电脑上帮你调文件、开聚会、扫异常,,,它们都指向统一个偏向:AI 正在从一个回覆问题的工具,,,酿成一个坐在工位上处理杂活的同事,,,区别只是这个同事是干杂活,,,照旧干专精的活。。。。。

腾讯OpenAI谷歌们拼尽全力争取「AI 工位」

这一轮抢位置的热度,,,很洪流平上是 OpenClaw 烧起来的。。。。。

OpenClaw 的前身叫 Clawdbot,,,奥地利自力开发者 Peter Steinberger 在 2025 年 11 月做出来的,,,开源、可以跑在外地。。。。。早先没有几多人注重,,,直到 2026 年 1 月几个视频传开,,,好比「AI 自主买车」「30 分钟完成代码迁徙」,,,开发者圈子一下子炸了。。。。。Clawdbot 两次因商标问题更名,,,最终命名 OpenClaw,,,从第一个版本到 GitHub Stars 破 25 万,,,只用了约莫 60 天,,,速率比 React 十年积累的还快。。。。。首创人随后在 2 月加入了 OpenAI,,,继续做 Agent 偏向。。。。。

OpenClaw 之以是能爆,,,不但是由于它新鲜,,,而是它第一次让通俗用户真实感受到「AI 在帮我干活」是什么感受,,,而不是「AI 在帮我回覆问题」。。。。。它能读外地文件、操作应用、挪用浏览器、执行多方法使命,,,靠一套叫 ClawHub 的手艺注册表把 LLM 和真实工具连起来。。。。。这套架构证实晰一件事,,,那就是把 AI 酿成一个真的在电脑上干活的角色,,,这件事手艺上是可以做到的,,,并且用户愿意用。。。。。

(图源:雷科技制图)

OpenAI 最最先推出 Codex 的时间,,,它还只是一个较量纯粹的 AI 代码工具,,,给开发者写代码、修 bug、提 PR 用的。。。。。但从 2025 年 5 月到现在,,,Codex 悄悄酿成了另一个工具——它能操作电脑、运行内置浏览器、处理图片、跨工具执行使命,,,还加入了「Goal Mode」,,,也就是你说一个目的和乐成标准,,,让它自己一连跑,,,知道使命完成。。。。。

这个转变不是 OpenAI 一最先就妄想好的产品蹊径,,,一个足够醒目的 Agent,,,只要在某一个场景里证实晰自己,,,就会自然地往相邻使命扩张。。。。。编程之后是代码调试,,,调试之后是项目治理,,,项目治理之后是操作浏览器、处理文件、明确上下文等等。。。。。

这也是为什么腾讯要从操作系统层级切入,,,Google 要把 Gemini Spark 做成 24 小时一直线的一连 Agent,,,微软要在 PowerPoint 里推进 Agent Mode,,,而不是继续升级谁人已经够用的谈天窗口。。。。。Gemini Spark 内置了对 Gmail、Google Docs、Sheets、Slides 的原生挪用权限,,,实质上,,,他们都在抢一个位置——「AI 工位」。。。。。

(图源:雷科技制图)

「AI 工位」最焦点的基础不是一台装了 AI 软件的电脑,,,也不是桌面上多出来的一个谈天框。。。。。更准确地说,,,AI 工位是一种新的事情关系,,,当人把目的、质料、权限和验收标准交出去,,,AI 就在文件、应用、浏览器、系统和云服务之间调理行动,,,人从执行者酿成治理者、审核者和最后拍板的人。。。。。虽然,,,这着实就是把 AI 当「牛马」用。。。。。

AI 办公加速迭代,,,通俗人成最大受益者

AI 工位对通俗人的意义,,,不是让每个人突然拥有一个高峻上的智能办公室,,,而是把「我亲自操作软件」酿成「我分配一件事情」。。。。。人不再需要记着质料放在哪个文件夹、哪个应用认真哪一步、输出要复制到那里,,,而是把目的说清晰,,,让 AI 去找、去读、去整理、去挪用工具,,,最后把效果交回来,,,就像你在用马维斯的时间,,,你可以看到哪个 Agent 被你挪用,,,哪个 Agent 又去「摸鱼」了。。。。。

这也是为什么它会比单点工具更适合通俗人,,,也更是大厂们想要抢夺的入口。。。。。一个 PPT 插件再好,,,实质上照旧帮你做一份 PPT;; ;;;一个真正成熟的 AI 工位,,,除了完成这份 PPT,,,还会顺便帮你准备好汇报的其他需求。。。。。这就是插件和 AI 工位的区别。。。。。

(图源:雷科技制图)

虽然,,,现在来说,,,通俗人会最先感受到AI 工位的副作用,,,好比 AI 要替你干活,,,就必需望见更多文件、拿到更多权限、明确更多上下文,,,以前你把一句话丢给谈天机械人,,,错了大不了重问,,,现在把一串使命交给 Agent,,,错的可能是文件、数据、日程、名堂,,,甚至是一次对外发送。。。。。以是 AI 工位真正普及之前,,,用户需要学会的不是更重大的提醒词,,,而是更清晰地界说目的、限制界线、检查效果。。。。。

但至少,,,AI 工位把我们从「打工的牛马」中解放出来,,,这就是它爆火的焦点原因。。。。。

 

文章点评

未盘问到任何数据!

揭晓谈论

◎接待加入讨论,,,请在这里揭晓您的看法、交流您的看法。。。。。

最新文章

热门文章

随机推荐

【网站地图】