凯时AG

环球热门新闻资讯
2026-06-14 19:45:59
首页 > 新闻 > 时政要闻 > 正文

测完几个Agent工具,,我发明他们能代打游戏了

发个指令,,给点权限,,AI就能自己翻开游戏库库玩了。。。。。

不懂咋玩??? ???那就截图识别。。。。。没法操作??? ???直接现搓剧本。。。。。操作一坨??? ???甚至还能上网自己找攻略。。。。。

这就是现在跑在你电脑上的 AI Agent 能做到的事儿。。。。。

世超把市面上的一些 Agent 工具测了一遍,,好比Codex,,TRAE,,QoderWork,,Workbuddy,,Marvis等等。。。。。

只能说,,这玩意儿吹了这么久,,大伙儿可能真不必再张望了。。。。。

从左向右依次为:第一行WorkBuddy,,TRAE,,Marvis;;;第二行Codex,,QoderWork,,悟空

虽然,,一听 code 啥的,,大伙儿可能以为是为专业开发者造的,,门槛高,,学起来用起来会很贫困。。。。。

诶,,莫担心,,大厂们也都悄摸进化一轮了。。。。。

之前确实硬核了点,,一个两个的都照搬 VS Code 那种古板的编程页面,,适合开发,,但并不适合和 AI 一起开发。。。。。

VS Code页面

既然引入 Agent 了,, 那肯定得重新设计,,事实它是来干活的,,而人是监视它的。。。。。

以是各人都很默契地改了统一套交互逻辑,,把详细的代码隐去,,再把 Agent 干活儿时的日志显示出来。。。。。

在网页里你可以叫它先生,,但在 Agent 工具里,,你得化身老板,,把活儿给摊派明确。。。。。

咱先来看界面,,也很精练,,主要三个部分。。。。。

左边是你手底下掌管的项目,,中心是通例的谈天窗口,,右边就能看到期待验收的工具了 ( 一般等事情最先了才会有新闻 )。。。。。

向左滑动,,依次为:Codex,,TRAE,,WorkBuddy,,Qoderwork

能 BB 就不下手,,咱先去 Agent 工具的 “ 应用市肆 ” 里走走,,看看有啥合适的手艺包,,也就是 Skill,,给 Agent 装上左膀右臂。。。。。

能看到,,琳琅满目啊!。。。,事实活儿的种类也就那么多,,以是但凡著名有姓的基本都能扒拉到现成的方案。。。。。

什么数据剖析,,内容创作都不在话下,,虽然不至于个个都好用,,但参考参考终归是能少走点弯路的。。。。。

其中做的较量有新意的是腾讯新出的 Marvis,,把手艺市肆做成了类似小红书的信息流,,可以边刷边珍藏手艺。。。。。

再加上手艺在这些工具里是通用的,,以是最近小红书自己也上线了 Skill 市肆,,用起来也相当利便。。。。。

虽然,,就算挑不过来也没关系,,手艺市肆里尚有帮咱选手艺的手艺。。。。。

Codex 里叫 Skill Installer,,WorkBuddy 里叫 Find Skills,,算是将懒人式举行究竟。。。。。

左:Codex;;;右:WorkBuddy

至于自己造手艺倒是不必急,,虽然可以通过 AI 一步步指导造出来,,但先射箭后画靶一般都欠好使。。。。。

好的手艺往往是先自己跑通几遍,,再提炼总结,,会更接地气,,也更贴合自己的使用场景。。。。。

向左滑动,,依次为:WorkBuddy,,TRAE

选好手艺就可以最先使命了,,这里在最先前需要选一下使命类型,,默认的是通俗款,,但一般 Plan 模式更好使。。。。。

这点还挺主要的,,由于许多时间效果不睬想不是 Agent 太笨了,,而是咱自己也不知道想要什么。。。。。

这个 Plan 就是在使命最先前先计齐整下,,明确使命的条条框框。。。。。

有什么不当就直接改了,,不必比及最后才发明偏向跑偏了。。。。。

简朴说一下咱要做什么,,就能敲回车下发指令了。。。。。

为了看详细流程,,咱挑 3 个幸运儿来展示一下,,OpenAI 的 Codex,,字节的 TRAE 和 腾讯的 WorkBuddy,,海内外的都拉出来溜溜。。。。。

使命就原地 TP,,让它们仨锐评它们仨。。。。。

此时就能发明 Plan 的利益了,,好比执行使命前,,Codex 和 TRAE 都向我二次确认了下 WorkBuddy 详细是哪一个,,由于外洋有同名的应用,,容易混淆。。。。。

虽然,,由于都是默认的模子,,速率有快有慢,,但就报告效果来看,,确实各有 “ 特点 ” 呐。。。。。

先说 WorkBuddy,,给到一个忠实人,,上来也没问我报告是个啥形式,,吭哧吭哧就是干。。。。。

最后给的网页,,就效果来看,,照旧不错的,,排版和内容虽然 AI 味道重了点,,但花里胡哨的切合咱锐评的主基调。。。。。

并且调研后的结论相当低调,,把自己放在了靠后的位置,,喷起自己绝不手软,,实诚这一块儿到位了。。。。。

再来看 TRAE ,,给到一个人上人,,活儿干的较量详尽,,不管是前期的弹出式的表单妄想,,照旧中心的调研,,思绪都很清晰,,子 Agent 的挪用也是相当熟练了。。。。。

焦点结论里,,虽然把自己排到了老大,,但考量了 6 个维度,,总分是加权出来的,,也算是有理有据了。。。。。

最后的 Codex,,基本就是现在这个领域的标杆了,,报告里先来一手信源剖析,,就跟大伙儿拉开了点距离,,下面的评价也能显着感受到更深入一些,,连系了官方产品文档的内容。。。。。

模子好确实有优势,,但思量到海内用起来不利便,,暂且给到一个半夯吧。。。。。

接下来,,使命继续,,让他们把各自的报告天生一份可视化的落地页。。。。。

你可能会说这活儿在网页里也能做,,并且还更快。。。。。

倒也没错,,但差别的点在于,,这里你不需要把代码再复制粘贴到外地了,,并且最主要的,,Agent 会自己挪用工具,,去检查制品有没有 BUG。。。。。

好比同样的使命,,交给网页的 Gemini,,这家伙甩给我几百行代码,,我粘到外地翻开,,发明一片空缺。。。。。。。。。。。。。。。

而这些 Agent 会在交付之前就阻止这种情形。。。。。

WorkBuddy 是自己挪用了 3 次预览,,做了 2 次优化,,才把网页交给我。。。。。

TRAE 直接一些,,直接翻开了内置的浏览器,,通过差别角度的截图识别,,打不开就刷新重试,,直到确认渲染效果切合预期。。。。。

Codex 也一样,, 权限不敷,,总是截不着网页,,试了 N 次才确认好效果。。。。。

以是落地页的效果倒是其次,,重点是这套使命执行的逻辑,,是跟网页端应付交差完全差别的打法。。。。。

特殊是截图反馈的工具挪用,,相当于给电脑安了个赛博义眼。。。。。

而像 Codex 这种更进一步,,有 Computer Use 功效,,可以全局截图反馈!。。。,然后操作。。。。。相当于你电脑上的软件,,它都能翻开,,等模子能力更猛了,,代打几局 LOL 也不是不可能。。。。。

虽然,,除了手艺 skill,,这些 Agent 工具还能接入其他应用,,像是 GitHub,,邮箱,,网盘等。。。。。

更妙的是接入一些通讯软件,,像微信,,飞书,,这也是龙虾当初火起来的一大原因。。。。。

接入后就能双向链接,,甭管是从 Agent 往飞书发文档,,照旧从微信下令 Agent 往工位上下载资料,,都没问题。。。。。

像是之前远程软件的升级版,,加了个 Agent 当管家,,帮你 24 小时盯着自己的电脑,,随叫随到。。。。。

或者有一些准时的使命,,也能找到 “ 自动化 ” 这种类型的入口,,让它接受天天死板重复的流程性使命。。。。。

向左滑动,,依次为:Codex,,TRAE,,WorkBuddy,,Marvis

说了这么多,,着实无论是什么手段,,装什么插件,,实质上都是在约束,,控制着 Agent 朝咱预定的偏向产出工具。。。。。

有大佬全心优化的事情流,,有厂商调教好的影象系统,,也有利便适用的手艺包。。。。。

用专业点的话说这些都是 “ Harness ”,,原意是给马套上马具,,放这儿也是很是贴切了。。。。。

无论马具下面的模子是哪一匹,,这些 Agent 工具都得随套随用。。。。。

就用起来的体感而言,,Codex 是较量夯的,,模子给力,,额度还无意重制,,虽然需要一点手段,,但比起 Claude 要简朴得多,,适合想体验顶尖性能的折腾党。。。。。

要是不想贫困,,直接用海内大厂的方案也行,,嫌默认的模子笨,,就去买点 DeepSeek 的 API 接上,,也是妥妥的性价比平替。。。。。

至于平替内里选哪一个就取决于你的使用场景了,,微信和 WorkBuddy 搭伙利便,,飞书和 TRAE 集成更深,,钉钉那里就是 Qoder 以及咱没测到的悟空了,,不过逻辑都是一样的。。。。。

但话说回来,,Agent 工具也是有弱点的,,就是上的手段越多,,破费的模子 Token 也越多,,动不动几十分钟的长线使命,,账单会变得贼拉长。。。。。

以是有什么自制管饱的模子套餐,,大伙儿就各显神通吧。。。。。。。。。。。。。。。

而要是不太繁琐的活儿,,这些 Agent 工具也有免费的额度,,白嫖一下尝尝咸淡总是不亏的。。。。。

撰文:风华

编辑:江江 & 面线

美编:焕妍

图片、资料泉源:

Codex, TRAE, WorkBuddy, Marvis,,QoderWork,,悟空

黄河壶口瀑布现半清半浊“鸳鸯锅”奇异景观

责任编辑:黄碧仪

【网站地图】