凯时AG

测完几个Agent工具,,,,,我发明他们能代打游戏了

作者:吴政雪
宣布时间:2026-06-15 01:50:24
阅读量:6

测完几个Agent工具,,,,,我发明他们能代打游戏了

发个指令,,,,,给点权限,,,,,AI就能自己翻开游戏库库玩了。。。。。 。

不懂咋玩??????那就截图识别。。。。。 。没法操作??????直接现搓剧本。。。。。 。操作一坨??????甚至还能上网自己找攻略。。。。。 。

这就是现在跑在你电脑上的 AI Agent 能做到的事儿。。。。。 。

世超把市面上的一些 Agent 工具测了一遍,,,,,好比Codex,,,,,TRAE,,,,,QoderWork,,,,,Workbuddy,,,,,Marvis等等。。。。。 。

只能说,,,,,这玩意儿吹了这么久,,,,,大伙儿可能真不必再张望了。。。。。 。

从左向右依次为:第一行WorkBuddy,,,,,TRAE,,,,,Marvis;;;第二行Codex,,,,,QoderWork,,,,,悟空

虽然,,,,,一听 code 啥的,,,,,大伙儿可能以为是为专业开发者造的,,,,,门槛高,,,,,学起来用起来会很贫困。。。。。 。

诶,,,,,莫担心,,,,,大厂们也都悄摸进化一轮了。。。。。 。

之前确实硬核了点,,,,,一个两个的都照搬 VS Code 那种古板的编程页面,,,,,适合开发,,,,,但并不适合和 AI 一起开发。。。。。 。

VS Code页面

既然引入 Agent 了,,,,, 那肯定得重新设计,,,,,事实它是来干活的,,,,,而人是监视它的。。。。。 。

以是各人都很默契地改了统一套交互逻辑,,,,,把详细的代码隐去,,,,,再把 Agent 干活儿时的日志显示出来。。。。。 。

在网页里你可以叫它先生,,,,,但在 Agent 工具里,,,,,你得化身老板,,,,,把活儿给摊派明确。。。。。 。

咱先来看界面,,,,,也很精练,,,,,主要三个部分。。。。。 。

左边是你手底下掌管的项目,,,,,中心是通例的谈天窗口,,,,,右边就能看到期待验收的工具了 ( 一般等事情最先了才会有新闻 )。。。。。 。

向左滑动,,,,,依次为:Codex,,,,,TRAE,,,,,WorkBuddy,,,,,Qoderwork

能 BB 就不下手,,,,,咱先去 Agent 工具的 “ 应用市肆 ” 里走走,,,,,看看有啥合适的手艺包,,,,,也就是 Skill,,,,,给 Agent 装上左膀右臂。。。。。 。

能看到,,,,,琳琅满目啊,,,,,事实活儿的种类也就那么多,,,,,以是但凡著名有姓的基本都能扒拉到现成的方案。。。。。 。

什么数据剖析,,,,,内容创作都不在话下,,,,,虽然不至于个个都好用,,,,,但参考参考终归是能少走点弯路的。。。。。 。

其中做的较量有新意的是腾讯新出的 Marvis,,,,,把手艺市肆做成了类似小红书的信息流,,,,,可以边刷边珍藏手艺。。。。。 。

再加上手艺在这些工具里是通用的,,,,,以是最近小红书自己也上线了 Skill 市肆,,,,,用起来也相当利便。。。。。 。

虽然,,,,,就算挑不过来也没关系,,,,,手艺市肆里尚有帮咱选手艺的手艺。。。。。 。

Codex 里叫 Skill Installer,,,,,WorkBuddy 里叫 Find Skills,,,,,算是将懒人式举行究竟。。。。。 。

左:Codex;;;右:WorkBuddy

至于自己造手艺倒是不必急,,,,,虽然可以通过 AI 一步步指导造出来,,,,,但先射箭后画靶一般都欠好使。。。。。 。

好的手艺往往是先自己跑通几遍,,,,,再提炼总结,,,,,会更接地气,,,,,也更贴合自己的使用场景。。。。。 。

向左滑动,,,,,依次为:WorkBuddy,,,,,TRAE

选好手艺就可以最先使命了,,,,,这里在最先前需要选一下使命类型,,,,,默认的是通俗款,,,,,但一般 Plan 模式更好使。。。。。 。

这点还挺主要的,,,,,由于许多时间效果不睬想不是 Agent 太笨了,,,,,而是咱自己也不知道想要什么。。。。。 。

这个 Plan 就是在使命最先前先计齐整下,,,,,明确使命的条条框框。。。。。 。

有什么不当就直接改了,,,,,不必比及最后才发明偏向跑偏了。。。。。 。

简朴说一下咱要做什么,,,,,就能敲回车下发指令了。。。。。 。

为了看详细流程,,,,,咱挑 3 个幸运儿来展示一下,,,,,OpenAI 的 Codex,,,,,字节的 TRAE 和 腾讯的 WorkBuddy,,,,,海内外的都拉出来溜溜。。。。。 。

使命就原地 TP,,,,,让它们仨锐评它们仨。。。。。 。

此时就能发明 Plan 的利益了,,,,,好比执行使命前,,,,,Codex 和 TRAE 都向我二次确认了下 WorkBuddy 详细是哪一个,,,,,由于外洋有同名的应用,,,,,容易混淆。。。。。 。

虽然,,,,,由于都是默认的模子,,,,,速率有快有慢,,,,,但就报告效果来看,,,,,确实各有 “ 特点 ” 呐。。。。。 。

先说 WorkBuddy,,,,,给到一个忠实人,,,,,上来也没问我报告是个啥形式,,,,,吭哧吭哧就是干。。。。。 。

最后给的网页,,,,,就效果来看,,,,,照旧不错的,,,,,排版和内容虽然 AI 味道重了点,,,,,但花里胡哨的切合咱锐评的主基调。。。。。 。

并且调研后的结论相当低调,,,,,把自己放在了靠后的位置,,,,,喷起自己绝不手软,,,,,实诚这一块儿到位了。。。。。 。

再来看 TRAE ,,,,,给到一个人上人,,,,,活儿干的较量详尽,,,,,不管是前期的弹出式的表单妄想,,,,,照旧中心的调研,,,,,思绪都很清晰,,,,,子 Agent 的挪用也是相当熟练了。。。。。 。

焦点结论里,,,,,虽然把自己排到了老大,,,,,但考量了 6 个维度,,,,,总分是加权出来的,,,,,也算是有理有据了。。。。。 。

最后的 Codex,,,,,基本就是现在这个领域的标杆了,,,,,报告里先来一手信源剖析,,,,,就跟大伙儿拉开了点距离,,,,,下面的评价也能显着感受到更深入一些,,,,,连系了官方产品文档的内容。。。。。 。

模子好确实有优势,,,,,但思量到海内用起来不利便,,,,,暂且给到一个半夯吧。。。。。 。

接下来,,,,,使命继续,,,,,让他们把各自的报告天生一份可视化的落地页。。。。。 。

你可能会说这活儿在网页里也能做,,,,,并且还更快。。。。。 。

倒也没错,,,,,但差别的点在于,,,,,这里你不需要把代码再复制粘贴到外地了,,,,,并且最主要的,,,,,Agent 会自己挪用工具,,,,,去检查制品有没有 BUG。。。。。 。

好比同样的使命,,,,,交给网页的 Gemini,,,,,这家伙甩给我几百行代码,,,,,我粘到外地翻开,,,,,发明一片空缺。。。。。 。。。。。。 。。。。。。 。

而这些 Agent 会在交付之前就阻止这种情形。。。。。 。

WorkBuddy 是自己挪用了 3 次预览,,,,,做了 2 次优化,,,,,才把网页交给我。。。。。 。

TRAE 直接一些,,,,,直接翻开了内置的浏览器,,,,,通过差别角度的截图识别,,,,,打不开就刷新重试,,,,,直到确认渲染效果切合预期。。。。。 。

Codex 也一样,,,,, 权限不敷,,,,,总是截不着网页,,,,,试了 N 次才确认好效果。。。。。 。

以是落地页的效果倒是其次,,,,,重点是这套使命执行的逻辑,,,,,是跟网页端应付交差完全差别的打法。。。。。 。

特殊是截图反馈的工具挪用,,,,,相当于给电脑安了个赛博义眼。。。。。 。

而像 Codex 这种更进一步,,,,,有 Computer Use 功效,,,,,可以全局截图反馈,,,,,然后操作。。。。。 。相当于你电脑上的软件,,,,,它都能翻开,,,,,等模子能力更猛了,,,,,代打几局 LOL 也不是不可能。。。。。 。

虽然,,,,,除了手艺 skill,,,,,这些 Agent 工具还能接入其他应用,,,,,像是 GitHub,,,,,邮箱,,,,,网盘等。。。。。 。

更妙的是接入一些通讯软件,,,,,像微信,,,,,飞书,,,,,这也是龙虾当初火起来的一大原因。。。。。 。

接入后就能双向链接,,,,,甭管是从 Agent 往飞书发文档,,,,,照旧从微信下令 Agent 往工位上下载资料,,,,,都没问题。。。。。 。

像是之前远程软件的升级版,,,,,加了个 Agent 当管家,,,,,帮你 24 小时盯着自己的电脑,,,,,随叫随到。。。。。 。

或者有一些准时的使命,,,,,也能找到 “ 自动化 ” 这种类型的入口,,,,,让它接受天天死板重复的流程性使命。。。。。 。

向左滑动,,,,,依次为:Codex,,,,,TRAE,,,,,WorkBuddy,,,,,Marvis

说了这么多,,,,,着实无论是什么手段,,,,,装什么插件,,,,,实质上都是在约束,,,,,控制着 Agent 朝咱预定的偏向产出工具。。。。。 。

有大佬全心优化的事情流,,,,,有厂商调教好的影象系统,,,,,也有利便适用的手艺包。。。。。 。

用专业点的话说这些都是 “ Harness ”,,,,,原意是给马套上马具,,,,,放这儿也是很是贴切了。。。。。 。

无论马具下面的模子是哪一匹,,,,,这些 Agent 工具都得随套随用。。。。。 。

就用起来的体感而言,,,,,Codex 是较量夯的,,,,,模子给力,,,,,额度还无意重制,,,,,虽然需要一点手段,,,,,但比起 Claude 要简朴得多,,,,,适合想体验顶尖性能的折腾党。。。。。 。

要是不想贫困,,,,,直接用海内大厂的方案也行,,,,,嫌默认的模子笨,,,,,就去买点 DeepSeek 的 API 接上,,,,,也是妥妥的性价比平替。。。。。 。

至于平替内里选哪一个就取决于你的使用场景了,,,,,微信和 WorkBuddy 搭伙利便,,,,,飞书和 TRAE 集成更深,,,,,钉钉那里就是 Qoder 以及咱没测到的悟空了,,,,,不过逻辑都是一样的。。。。。 。

但话说回来,,,,,Agent 工具也是有弱点的,,,,,就是上的手段越多,,,,,破费的模子 Token 也越多,,,,,动不动几十分钟的长线使命,,,,,账单会变得贼拉长。。。。。 。

以是有什么自制管饱的模子套餐,,,,,大伙儿就各显神通吧。。。。。 。。。。。。 。。。。。。 。

而要是不太繁琐的活儿,,,,,这些 Agent 工具也有免费的额度,,,,,白嫖一下尝尝咸淡总是不亏的。。。。。 。

撰文:风华

编辑:江江 & 面线

美编:焕妍

图片、资料泉源:

Codex, TRAE, WorkBuddy, Marvis,,,,,QoderWork,,,,,悟空

 

文章点评

未盘问到任何数据!

揭晓谈论

◎接待加入讨论,,,,,请在这里揭晓您的看法、交流您的看法。。。。。 。

最新文章

热门文章

随机推荐

【网站地图】