凯时AG

泉源:求媒体关注的17岁机车少年回应质疑作者: 伍翠中:

测完几个Agent工具,, , ,我发明他们能代打游戏了

发个指令,, , ,给点权限,, , ,AI就能自己翻开游戏库库玩了。。 。。

不懂咋玩 ????那就截图识别。。 。。没法操作 ????直接现搓剧本。。 。。操作一坨 ????甚至还能上网自己找攻略。。 。。

这就是现在跑在你电脑上的 AI Agent 能做到的事儿。。 。。

世超把市面上的一些 Agent 工具测了一遍,, , ,好比Codex,, , ,TRAE,, , ,QoderWork,, , ,Workbuddy,, , ,Marvis等等。。 。。

只能说,, , ,这玩意儿吹了这么久,, , ,大伙儿可能真不必再张望了。。 。。

从左向右依次为:第一行WorkBuddy,, , ,TRAE,, , ,Marvis ;;;;;第二行Codex,, , ,QoderWork,, , ,悟空

虽然,, , ,一听 code 啥的,, , ,大伙儿可能以为是为专业开发者造的,, , ,门槛高,, , ,学起来用起来会很贫困。。 。。

诶,, , ,莫担心,, , ,大厂们也都悄摸进化一轮了。。 。。

之前确实硬核了点,, , ,一个两个的都照搬 VS Code 那种古板的编程页面,, , ,适合开发,, , ,但并不适合和 AI 一起开发。。 。。

VS Code页面

既然引入 Agent 了,, , , 那肯定得重新设计,, , ,事实它是来干活的,, , ,而人是监视它的。。 。。

以是各人都很默契地改了统一套交互逻辑,, , ,把详细的代码隐去,, , ,再把 Agent 干活儿时的日志显示出来。。 。。

在网页里你可以叫它先生,, , ,但在 Agent 工具里,, , ,你得化身老板,, , ,把活儿给摊派明确。。 。。

咱先来看界面,, , ,也很精练,, , ,主要三个部分。。 。。

左边是你手底下掌管的项目,, , ,中心是通例的谈天窗口,, , ,右边就能看到期待验收的工具了 ( 一般等事情最先了才会有新闻 )。。 。。

向左滑动,, , ,依次为:Codex,, , ,TRAE,, , ,WorkBuddy,, , ,Qoderwork

能 BB 就不下手,, , ,咱先去 Agent 工具的 “ 应用市肆 ” 里走走,, , ,看看有啥合适的手艺包,, , ,也就是 Skill,, , ,给 Agent 装上左膀右臂。。 。。

能看到,, , ,琳琅满目啊,, , ,事实活儿的种类也就那么多,, , ,以是但凡著名有姓的基本都能扒拉到现成的方案。。 。。

什么数据剖析,, , ,内容创作都不在话下,, , ,虽然不至于个个都好用,, , ,但参考参考终归是能少走点弯路的。。 。。

其中做的较量有新意的是腾讯新出的 Marvis,, , ,把手艺市肆做成了类似小红书的信息流,, , ,可以边刷边珍藏手艺。。 。。

再加上手艺在这些工具里是通用的,, , ,以是最近小红书自己也上线了 Skill 市肆,, , ,用起来也相当利便。。 。。

虽然,, , ,就算挑不过来也没关系,, , ,手艺市肆里尚有帮咱选手艺的手艺。。 。。

Codex 里叫 Skill Installer,, , ,WorkBuddy 里叫 Find Skills,, , ,算是将懒人式举行究竟。。 。。

左:Codex ;;;;;右:WorkBuddy

至于自己造手艺倒是不必急,, , ,虽然可以通过 AI 一步步指导造出来,, , ,但先射箭后画靶一般都欠好使。。 。。

好的手艺往往是先自己跑通几遍,, , ,再提炼总结,, , ,会更接地气,, , ,也更贴合自己的使用场景。。 。。

向左滑动,, , ,依次为:WorkBuddy,, , ,TRAE

选好手艺就可以最先使命了,, , ,这里在最先前需要选一下使命类型,, , ,默认的是通俗款,, , ,但一般 Plan 模式更好使。。 。。

这点还挺主要的,, , ,由于许多时间效果不睬想不是 Agent 太笨了,, , ,而是咱自己也不知道想要什么。。 。。

这个 Plan 就是在使命最先前先计齐整下,, , ,明确使命的条条框框。。 。。

有什么不当就直接改了,, , ,不必比及最后才发明偏向跑偏了。。 。。

简朴说一下咱要做什么,, , ,就能敲回车下发指令了。。 。。

为了看详细流程,, , ,咱挑 3 个幸运儿来展示一下,, , ,OpenAI 的 Codex,, , ,字节的 TRAE 和 腾讯的 WorkBuddy,, , ,海内外的都拉出来溜溜。。 。。

使命就原地 TP,, , ,让它们仨锐评它们仨。。 。。

此时就能发明 Plan 的利益了,, , ,好比执行使命前,, , ,Codex 和 TRAE 都向我二次确认了下 WorkBuddy 详细是哪一个,, , ,由于外洋有同名的应用,, , ,容易混淆。。 。。

虽然,, , ,由于都是默认的模子,, , ,速率有快有慢,, , ,但就报告效果来看,, , ,确实各有 “ 特点 ” 呐。。 。。

先说 WorkBuddy,, , ,给到一个忠实人,, , ,上来也没问我报告是个啥形式,, , ,吭哧吭哧就是干。。 。。

最后给的网页,, , ,就效果来看,, , ,照旧不错的,, , ,排版和内容虽然 AI 味道重了点,, , ,但花里胡哨的切合咱锐评的主基调。。 。。

并且调研后的结论相当低调,, , ,把自己放在了靠后的位置,, , ,喷起自己绝不手软,, , ,实诚这一块儿到位了。。 。。

再来看 TRAE ,, , ,给到一个人上人,, , ,活儿干的较量详尽,, , ,不管是前期的弹出式的表单妄想,, , ,照旧中心的调研,, , ,思绪都很清晰,, , ,子 Agent 的挪用也是相当熟练了。。 。。

焦点结论里,, , ,虽然把自己排到了老大,, , ,但考量了 6 个维度,, , ,总分是加权出来的,, , ,也算是有理有据了。。 。。

最后的 Codex,, , ,基本就是现在这个领域的标杆了,, , ,报告里先来一手信源剖析,, , ,就跟大伙儿拉开了点距离,, , ,下面的评价也能显着感受到更深入一些,, , ,连系了官方产品文档的内容。。 。。

模子好确实有优势,, , ,但思量到海内用起来不利便,, , ,暂且给到一个半夯吧。。 。。

接下来,, , ,使命继续,, , ,让他们把各自的报告天生一份可视化的落地页。。 。。

你可能会说这活儿在网页里也能做,, , ,并且还更快。。 。。

倒也没错,, , ,但差别的点在于,, , ,这里你不需要把代码再复制粘贴到外地了,, , ,并且最主要的,, , ,Agent 会自己挪用工具,, , ,去检查制品有没有 BUG。。 。。

好比同样的使命,, , ,交给网页的 Gemini,, , ,这家伙甩给我几百行代码,, , ,我粘到外地翻开,, , ,发明一片空缺。。 。。。。 。。。。 。。

而这些 Agent 会在交付之前就阻止这种情形。。 。。

WorkBuddy 是自己挪用了 3 次预览,, , ,做了 2 次优化,, , ,才把网页交给我。。 。。

TRAE 直接一些,, , ,直接翻开了内置的浏览器,, , ,通过差别角度的截图识别,, , ,打不开就刷新重试,, , ,直到确认渲染效果切合预期。。 。。

Codex 也一样,, , , 权限不敷,, , ,总是截不着网页,, , ,试了 N 次才确认好效果。。 。。

以是落地页的效果倒是其次,, , ,重点是这套使命执行的逻辑,, , ,是跟网页端应付交差完全差别的打法。。 。。

特殊是截图反馈的工具挪用,, , ,相当于给电脑安了个赛博义眼。。 。。

而像 Codex 这种更进一步,, , ,有 Computer Use 功效,, , ,可以全局截图反馈,, , ,然后操作。。 。。相当于你电脑上的软件,, , ,它都能翻开,, , ,等模子能力更猛了,, , ,代打几局 LOL 也不是不可能。。 。。

虽然,, , ,除了手艺 skill,, , ,这些 Agent 工具还能接入其他应用,, , ,像是 GitHub,, , ,邮箱,, , ,网盘等。。 。。

更妙的是接入一些通讯软件,, , ,像微信,, , ,飞书,, , ,这也是龙虾当初火起来的一大原因。。 。。

接入后就能双向链接,, , ,甭管是从 Agent 往飞书发文档,, , ,照旧从微信下令 Agent 往工位上下载资料,, , ,都没问题。。 。。

像是之前远程软件的升级版,, , ,加了个 Agent 当管家,, , ,帮你 24 小时盯着自己的电脑,, , ,随叫随到。。 。。

或者有一些准时的使命,, , ,也能找到 “ 自动化 ” 这种类型的入口,, , ,让它接受天天死板重复的流程性使命。。 。。

向左滑动,, , ,依次为:Codex,, , ,TRAE,, , ,WorkBuddy,, , ,Marvis

说了这么多,, , ,着实无论是什么手段,, , ,装什么插件,, , ,实质上都是在约束,, , ,控制着 Agent 朝咱预定的偏向产出工具。。 。。

有大佬全心优化的事情流,, , ,有厂商调教好的影象系统,, , ,也有利便适用的手艺包。。 。。

用专业点的话说这些都是 “ Harness ”,, , ,原意是给马套上马具,, , ,放这儿也是很是贴切了。。 。。

无论马具下面的模子是哪一匹,, , ,这些 Agent 工具都得随套随用。。 。。

就用起来的体感而言,, , ,Codex 是较量夯的,, , ,模子给力,, , ,额度还无意重制,, , ,虽然需要一点手段,, , ,但比起 Claude 要简朴得多,, , ,适合想体验顶尖性能的折腾党。。 。。

要是不想贫困,, , ,直接用海内大厂的方案也行,, , ,嫌默认的模子笨,, , ,就去买点 DeepSeek 的 API 接上,, , ,也是妥妥的性价比平替。。 。。

至于平替内里选哪一个就取决于你的使用场景了,, , ,微信和 WorkBuddy 搭伙利便,, , ,飞书和 TRAE 集成更深,, , ,钉钉那里就是 Qoder 以及咱没测到的悟空了,, , ,不过逻辑都是一样的。。 。。

但话说回来,, , ,Agent 工具也是有弱点的,, , ,就是上的手段越多,, , ,破费的模子 Token 也越多,, , ,动不动几十分钟的长线使命,, , ,账单会变得贼拉长。。 。。

以是有什么自制管饱的模子套餐,, , ,大伙儿就各显神通吧。。 。。。。 。。。。 。。

而要是不太繁琐的活儿,, , ,这些 Agent 工具也有免费的额度,, , ,白嫖一下尝尝咸淡总是不亏的。。 。。

撰文:风华

编辑:江江 & 面线

美编:焕妍

图片、资料泉源:

Codex, TRAE, WorkBuddy, Marvis,, , ,QoderWork,, , ,悟空

@谢哲荣:1号游戏交易,, , ,老挝国家主席 ????刂泄等肆廾
@张薇辰:主顾写差评求免单是否涉嫌诓骗勒索
@张松伶:赵心童第一时间祝贺吴宜泽夺冠

热门排行

【网站地图】