凯时AG

2026-06-15 13:54:24 设为首页 | 加入珍藏

测完几个Agent工具,,,,,,我发明他们能代打游戏了

2026-06-15 13:54:24 宣布 泉源:博客园下载 作者:张俊杰 浏览:1338次

发个指令,,,,,,给点权限,,,,,,AI就能自己翻开游戏库库玩了。 。。。。。

不懂咋玩? ?????那就截图识别。 。。。。。没法操作? ?????直接现搓剧本。 。。。。。操作一坨? ?????甚至还能上网自己找攻略。 。。。。。

这就是现在跑在你电脑上的 AI Agent 能做到的事儿。 。。。。。

世超把市面上的一些 Agent 工具测了一遍,,,,,,好比Codex,,,,,,TRAE,,,,,,QoderWork,,,,,,Workbuddy,,,,,,Marvis等等。 。。。。。

只能说,,,,,,这玩意儿吹了这么久,,,,,,大伙儿可能真不必再张望了。 。。。。。

从左向右依次为:第一行WorkBuddy,,,,,,TRAE,,,,,,Marvis;;;第二行Codex,,,,,,QoderWork,,,,,,悟空

虽然,,,,,,一听 code 啥的,,,,,,大伙儿可能以为是为专业开发者造的,,,,,,门槛高,,,,,,学起来用起来会很贫困。 。。。。。

诶,,,,,,莫担心,,,,,,大厂们也都悄摸进化一轮了。 。。。。。

之前确实硬核了点,,,,,,一个两个的都照搬 VS Code 那种古板的编程页面,,,,,,适合开发,,,,,,但并不适合和 AI 一起开发。 。。。。。

VS Code页面

既然引入 Agent 了,,,,,, 那肯定得重新设计,,,,,,事实它是来干活的,,,,,,而人是监视它的。 。。。。。

以是各人都很默契地改了统一套交互逻辑,,,,,,把详细的代码隐去,,,,,,再把 Agent 干活儿时的日志显示出来。 。。。。。

在网页里你可以叫它先生,,,,,,但在 Agent 工具里,,,,,,你得化身老板,,,,,,把活儿给摊派明确。 。。。。。

咱先来看界面,,,,,,也很精练,,,,,,主要三个部分。 。。。。。

左边是你手底下掌管的项目,,,,,,中心是通例的谈天窗口,,,,,,右边就能看到期待验收的工具了 ( 一般等事情最先了才会有新闻 )。 。。。。。

向左滑动,,,,,,依次为:Codex,,,,,,TRAE,,,,,,WorkBuddy,,,,,,Qoderwork

能 BB 就不下手,,,,,,咱先去 Agent 工具的 “ 应用市肆 ” 里走走,,,,,,看看有啥合适的手艺包,,,,,,也就是 Skill,,,,,,给 Agent 装上左膀右臂。 。。。。。

能看到,,,,,,琳琅满目。 。。。。。,,,事实活儿的种类也就那么多,,,,,,以是但凡著名有姓的基本都能扒拉到现成的方案。 。。。。。

什么数据剖析,,,,,,内容创作都不在话下,,,,,,虽然不至于个个都好用,,,,,,但参考参考终归是能少走点弯路的。 。。。。。

其中做的较量有新意的是腾讯新出的 Marvis,,,,,,把手艺市肆做成了类似小红书的信息流,,,,,,可以边刷边珍藏手艺。 。。。。。

再加上手艺在这些工具里是通用的,,,,,,以是最近小红书自己也上线了 Skill 市肆,,,,,,用起来也相当利便。 。。。。。

虽然,,,,,,就算挑不过来也没关系,,,,,,手艺市肆里尚有帮咱选手艺的手艺。 。。。。。

Codex 里叫 Skill Installer,,,,,,WorkBuddy 里叫 Find Skills,,,,,,算是将懒人式举行究竟。 。。。。。

左:Codex;;;右:WorkBuddy

至于自己造手艺倒是不必急,,,,,,虽然可以通过 AI 一步步指导造出来,,,,,,但先射箭后画靶一般都欠好使。 。。。。。

好的手艺往往是先自己跑通几遍,,,,,,再提炼总结,,,,,,会更接地气,,,,,,也更贴合自己的使用场景。 。。。。。

向左滑动,,,,,,依次为:WorkBuddy,,,,,,TRAE

选好手艺就可以最先使命了,,,,,,这里在最先前需要选一下使命类型,,,,,,默认的是通俗款,,,,,,但一般 Plan 模式更好使。 。。。。。

这点还挺主要的,,,,,,由于许多时间效果不睬想不是 Agent 太笨了,,,,,,而是咱自己也不知道想要什么。 。。。。。

这个 Plan 就是在使命最先前先计齐整下,,,,,,明确使命的条条框框。 。。。。。

有什么不当就直接改了,,,,,,不必比及最后才发明偏向跑偏了。 。。。。。

简朴说一下咱要做什么,,,,,,就能敲回车下发指令了。 。。。。。

为了看详细流程,,,,,,咱挑 3 个幸运儿来展示一下,,,,,,OpenAI 的 Codex,,,,,,字节的 TRAE 和 腾讯的 WorkBuddy,,,,,,海内外的都拉出来溜溜。 。。。。。

使命就原地 TP,,,,,,让它们仨锐评它们仨。 。。。。。

此时就能发明 Plan 的利益了,,,,,,好比执行使命前,,,,,,Codex 和 TRAE 都向我二次确认了下 WorkBuddy 详细是哪一个,,,,,,由于外洋有同名的应用,,,,,,容易混淆。 。。。。。

虽然,,,,,,由于都是默认的模子,,,,,,速率有快有慢,,,,,,但就报告效果来看,,,,,,确实各有 “ 特点 ” 呐。 。。。。。

先说 WorkBuddy,,,,,,给到一个忠实人,,,,,,上来也没问我报告是个啥形式,,,,,,吭哧吭哧就是干。 。。。。。

最后给的网页,,,,,,就效果来看,,,,,,照旧不错的,,,,,,排版和内容虽然 AI 味道重了点,,,,,,但花里胡哨的切合咱锐评的主基调。 。。。。。

并且调研后的结论相当低调,,,,,,把自己放在了靠后的位置,,,,,,喷起自己绝不手软,,,,,,实诚这一块儿到位了。 。。。。。

再来看 TRAE ,,,,,,给到一个人上人,,,,,,活儿干的较量详尽,,,,,,不管是前期的弹出式的表单妄想,,,,,,照旧中心的调研,,,,,,思绪都很清晰,,,,,,子 Agent 的挪用也是相当熟练了。 。。。。。

焦点结论里,,,,,,虽然把自己排到了老大,,,,,,但考量了 6 个维度,,,,,,总分是加权出来的,,,,,,也算是有理有据了。 。。。。。

最后的 Codex,,,,,,基本就是现在这个领域的标杆了,,,,,,报告里先来一手信源剖析,,,,,,就跟大伙儿拉开了点距离,,,,,,下面的评价也能显着感受到更深入一些,,,,,,连系了官方产品文档的内容。 。。。。。

模子好确实有优势,,,,,,但思量到海内用起来不利便,,,,,,暂且给到一个半夯吧。 。。。。。

接下来,,,,,,使命继续,,,,,,让他们把各自的报告天生一份可视化的落地页。 。。。。。

你可能会说这活儿在网页里也能做,,,,,,并且还更快。 。。。。。

倒也没错,,,,,,但差别的点在于,,,,,,这里你不需要把代码再复制粘贴到外地了,,,,,,并且最主要的,,,,,,Agent 会自己挪用工具,,,,,,去检查制品有没有 BUG。 。。。。。

好比同样的使命,,,,,,交给网页的 Gemini,,,,,,这家伙甩给我几百行代码,,,,,,我粘到外地翻开,,,,,,发明一片空缺。 。。。。。。 。。。。。。 。。。。。

而这些 Agent 会在交付之前就阻止这种情形。 。。。。。

WorkBuddy 是自己挪用了 3 次预览,,,,,,做了 2 次优化,,,,,,才把网页交给我。 。。。。。

TRAE 直接一些,,,,,,直接翻开了内置的浏览器,,,,,,通过差别角度的截图识别,,,,,,打不开就刷新重试,,,,,,直到确认渲染效果切合预期。 。。。。。

Codex 也一样,,,,,, 权限不敷,,,,,,总是截不着网页,,,,,,试了 N 次才确认好效果。 。。。。。

以是落地页的效果倒是其次,,,,,,重点是这套使命执行的逻辑,,,,,,是跟网页端应付交差完全差别的打法。 。。。。。

特殊是截图反馈的工具挪用,,,,,,相当于给电脑安了个赛博义眼。 。。。。。

而像 Codex 这种更进一步,,,,,,有 Computer Use 功效,,,,,,可以全局截图反。 。。。。。,,,然后操作。 。。。。。相当于你电脑上的软件,,,,,,它都能翻开,,,,,,等模子能力更猛了,,,,,,代打几局 LOL 也不是不可能。 。。。。。

虽然,,,,,,除了手艺 skill,,,,,,这些 Agent 工具还能接入其他应用,,,,,,像是 GitHub,,,,,,邮箱,,,,,,网盘等。 。。。。。

更妙的是接入一些通讯软件,,,,,,像微信,,,,,,飞书,,,,,,这也是龙虾当初火起来的一大原因。 。。。。。

接入后就能双向链接,,,,,,甭管是从 Agent 往飞书发文档,,,,,,照旧从微信下令 Agent 往工位上下载资料,,,,,,都没问题。 。。。。。

像是之前远程软件的升级版,,,,,,加了个 Agent 当管家,,,,,,帮你 24 小时盯着自己的电脑,,,,,,随叫随到。 。。。。。

或者有一些准时的使命,,,,,,也能找到 “ 自动化 ” 这种类型的入口,,,,,,让它接受天天死板重复的流程性使命。 。。。。。

向左滑动,,,,,,依次为:Codex,,,,,,TRAE,,,,,,WorkBuddy,,,,,,Marvis

说了这么多,,,,,,着实无论是什么手段,,,,,,装什么插件,,,,,,实质上都是在约束,,,,,,控制着 Agent 朝咱预定的偏向产出工具。 。。。。。

有大佬全心优化的事情流,,,,,,有厂商调教好的影象系统,,,,,,也有利便适用的手艺包。 。。。。。

用专业点的话说这些都是 “ Harness ”,,,,,,原意是给马套上马具,,,,,,放这儿也是很是贴切了。 。。。。。

无论马具下面的模子是哪一匹,,,,,,这些 Agent 工具都得随套随用。 。。。。。

就用起来的体感而言,,,,,,Codex 是较量夯的,,,,,,模子给力,,,,,,额度还无意重制,,,,,,虽然需要一点手段,,,,,,但比起 Claude 要简朴得多,,,,,,适合想体验顶尖性能的折腾党。 。。。。。

要是不想贫困,,,,,,直接用海内大厂的方案也行,,,,,,嫌默认的模子笨,,,,,,就去买点 DeepSeek 的 API 接上,,,,,,也是妥妥的性价比平替。 。。。。。

至于平替内里选哪一个就取决于你的使用场景了,,,,,,微信和 WorkBuddy 搭伙利便,,,,,,飞书和 TRAE 集成更深,,,,,,钉钉那里就是 Qoder 以及咱没测到的悟空了,,,,,,不过逻辑都是一样的。 。。。。。

但话说回来,,,,,,Agent 工具也是有弱点的,,,,,,就是上的手段越多,,,,,,破费的模子 Token 也越多,,,,,,动不动几十分钟的长线使命,,,,,,账单会变得贼拉长。 。。。。。

以是有什么自制管饱的模子套餐,,,,,,大伙儿就各显神通吧。 。。。。。。 。。。。。。 。。。。。

而要是不太繁琐的活儿,,,,,,这些 Agent 工具也有免费的额度,,,,,,白嫖一下尝尝咸淡总是不亏的。 。。。。。

撰文:风华

编辑:江江 & 面线

美编:焕妍

图片、资料泉源:

Codex, TRAE, WorkBuddy, Marvis,,,,,,QoderWork,,,,,,悟空

美国恒久对古巴实验经济、金融封锁和商业禁运。 。。。。。美国今年年头对委内瑞拉发动大规模军事攻击后,,,,,,进一步加大对古巴施压。 。。。。。

责任编辑:张芷念    校对:竺欣怡

今日热门

  1. 为啥越来越多的人最先追求“活人感”? ?????
  2. 中美关系回不到已往,,,,,,但能够有一个更好的未来——写在中美元首会晤之际
  3. 晚上睡前刷牙、刷牙后漱口竟都是错的 许多人都在“无效刷牙”
  4. 中外媒体聚焦内蒙古:探索“绿色高质量生长”的北方实践
  5. 青海审查机关两年受理行政审查监视案件近3500件
  6. 数读中国开局新活力|青年占比超50% 小镇20年长成“青春经济”样本
  7. 武契奇在小米汽车工厂买了啥
  8. 返回舱直立落地有多灾? ?????这些关于航天的“冷知识”你知道吗
  9. 空军一号轰鸣 这名解放军器爆外网
  10. 皮尔斯:建队基石肯定选文班亚马

相关推荐

【网站地图】