凯时AG

彻底杀死提醒词角逐,,,,,,Agent Loop是什么鬼????

作者:李丽礼
宣布时间:2026-07-04 05:45:06
阅读量:282

彻底杀死提醒词角逐,,,,,,Agent Loop是什么鬼????

昨天小雷刷到吴恩达在 X 上的一篇推文,,,,,,讲的是 Agent 的 Loop(循环)工程。。。。。。

图片泉源:X

若是你最近半年用过 Claude Code、Codex、Workbuddy、Kimi Work 或者其他 Agent 产品,,,,,,你可能已经感受到了那种转变——相比已往一句一句教 AI 干什么,,,,,,现在你把需求扔进去,,,,,,它自己会写、会跑、会报错了自己改,,,,,,直到把工具做出来。。。。。。

这种「自己转起来」的感受,,,,,,就是 Loop 工程在 Agent 产品上的落地。。。。。。

「……你不应再给 Coding Agent 写提醒词了,,,,,,你应该设计 Loop。。。。。。」6 月,,,,,,OpenClaw(龙虾)首创人 Peter Steinberger 一条推引起大宗的讨论。。。。。。事实上,,,,,,就在这之前不久,,,,,,Google 工程认真人 Addy Osmani 系统性整理 Loop 这个看法,,,,,,提出了 Loop 工程。。。。。。

图片泉源:X

不过从果真信息来看,,,,,,最早提出 Loop 的人,,,,,,也是最早让它发光发热的 Claude Code 首创人 Boris Cherny。。。。。。就在 6 月尾,,,,,,Anthropic 还发了篇博客,,,,,,把 Claude Code 里的四种 loop 原语所有果真。。。。。。

一个月的时间,,,,,,Loop 工程基本完成了一次华美的转身,,,,,,不但是行业共识,,,,,,也成为了主流的焦点。。。。。。以是,,,,,,究竟什么是 Loop????对我们通俗用户又有什么影响????

从提醒词到 Harness 和 Loop,,,,,,Agent 究竟多了什么????

已往讲 AI 使用,,,,,,绕不开提醒词。。。。。。你让模子写代码、改文档、做研究,,,,,,提醒词写得越细,,,,,,效果越像样。。。。。。从模子走向 Agent,,,,,,模子不但要回覆,,,,,,还要知道什么时间读文件、什么时间跑下令、什么时间查网页、什么时间停下来问人,,,,,,提醒词工程、头脑链基础不敷用。。。。。。

以是泛起了 Harness 工程。。。。。。它可以明确成模子外面那套运行框架,,,,,,认真接工具、管权限、塞上下文、存状态。。。。。。模子照旧认真推理和天生,,,,,,但它最先被放进一个能执行使命的情形里。。。。。。

Loop 工程又往前走了一步,,,,,,它体贴怎么让 Agent 围绕一个目的一直「循环」运作。。。。。。

「龙虾」官方文档将 Loop 视为「基础」,,,,,,图片泉源:OpenClaw

简朴来说,,,,,,用户给出目的,,,,,,Agent 先明确使命,,,,,,再拿上下文,,,,,,挪用工具,,,,,,视察效果,,,,,,判断有没有完成;;;没完成,,,,,,就继续改,,,,,,继续跑,,,,,,继续检查。。。。。。这个历程看起来像人类事情的日常:先做一版,,,,,,发明问题,,,,,,再修一版,,,,,,直到效果能交付。。。。。。

以是 Loop 的重点不在「循环」这个词自己,,,,,,而在循环里究竟放了什么。。。。。。

Claude Code 的例子最典范。。。。。。它不是简朴把 Claude 接到终端,,,,,,而是让模子在一个 while-loop 里重复挪用工具、编辑文件、运行下令、视察返回效果。。。。。。真正重大的部分反而在循环外面:权限系统、上下文压缩、插件、skills、hooks、子 Agent、会话存储。。。。。。

Agent 能不可自己转起来,,,,,,靠的不是模子一时兴起多想几步,,,,,,而是一整套工程设计托着它往前走。。。。。。

这也是吴恩达这次谈 Loop 工程的焦点配景。。。。。。到了 2026 年,,,,,,Claude Code、Codex、ZCode、MiniMax Code,,,,,,Agent 产品已经再把「写—跑—看效果—再改」酿成默认能力。。。。。。

Anthropic 在博客中还把 Loop 分成四种:turn-based(回合制)、goal-based(目的驱动)、time-based(准时触发)、proactive(自动式)。。。。。。

- 「帮我写个登录页面」,,,,,,它写、测、改,,,,,,这就是goal-based loop;;;- 你每发一条新闻它回一条,,,,,,这是 turn-based;;;- time-based 是你可以让它每隔两小时自动去检查某个PR,,,,,,有更新就帮你 review;;;- proactive 更激进,,,,,,它会自己发明问题、自己开干,,,,,,好比发明测试笼罩率下降了,,,,,,自己去补测试用例。。。。。。

目的驱动 Loop,,,,,,图片泉源:Anthropic

而这波讨论在 5、6 月突然变热,,,,,,也和产品希望有关。。。。。。OpenAI 的 Codex 已经不但是「帮你写代码」的入口,,,,,,而是在自力情形里读客栈、改文件、跑测试,,,,,,再把日志和效果交回来。。。。。。

Anthropic 这边,,,,,,Claude Code 自己险些成了 Loop 工程最好的样板。。。。。。Boris Cherny 那句「不再自己写提醒词,,,,,,而是让一个 Agent 去提醒 Claude」,,,,,,听起来有点绕,,,,,,但意思着实就是人不再认真每一步怎么问模子,,,,,,人认真设计让模子一连事情的机制。。。。。。

这也是 Loop 工程真正值得通俗用户体贴的地方。。。。。。Loop 工程做得越好,,,,,,Agent 越像一个能接住使命的人:你给它偏向,,,,,,它自己往前跑;;;跑偏了,,,,,,它能从反馈里拉回来;;;做完了,,,,,,它还会把历程和效果交给你检查。。。。。。

杀死提醒词,,,,,,对咱们通俗人究竟有什么用????

Agent Loop 对通俗用户最直接的价值,,,,,,就是降低提醒词设计门槛。。。。。。

已往用 AI,,,,,,很像在和一个智慧但没履历的实习生相助。。。。。。你得告诉它每一步怎么做,,,,,,什么时间停,,,,,,那里需要查资料,,,,,,那里不可乱编。。。。。。你指挥得越细,,,,,,它体现越好;;;你说得越粗,,,,,,它越容易跑偏。。。。。。

Loop 做得好的 Agent,,,,,,更像一个已经知道基本事情流程的人。。。。。。你也不必每次提醒它「若是代码报错就继续修」,,,,,,由于测试和返工原来就是循环的一部分。。。。。。你甚至不必把所有上下文一次性塞进对话框,,,,,,由于 Agent 可以通过文件系统、搜索工具、影象和索引自己逐步拿到需要的信息。。。。。。

这会改变用户和 AI 的关系。。。。。。

以前用户在写提醒词时,,,,,,经常要饰演产品司理、项目司理、测试工程师和先生。。。。。。你要给需求、拆方法、盯进度、改过失。。。。。。以后用户更像是在设目的和验收效果。。。。。。

好比你让一个 Agent 做旅行妄想。。。。。。已往你可能要写:预算几多、天数几多、先查机票、再查旅馆、注重交通、给我表格、最后总结。。。。。。Loop 做好以后,,,,,,你只要说「下个月去东京 5 天,,,,,,预算中等,,,,,,想少折腾,,,,,,多看展」,,,,,,Agent 就应该能自己查时间、比价钱、排蹊径、发明冲突、给出方案,,,,,,还能在你反馈「第二天太满」之后自动重排。。。。。。

这就是「杀死提醒词角逐」的第一层寄义。。。。。。通俗用户不再需要把自己训练成提醒词工程师,,,,,,Agent 产品应该替用户吸收重大流程。。。。。。

另一方面,,,,,,软件工程自然适合 Loop。。。。。。目的可以写成 issue,,,,,,历程可以拆成文件修改,,,,,,工具可以跑测试,,,,,,效果可以用 diff 和 CI 验证。。。。。。一个 Agent 写错了,,,,,,系统马上能看到报错;;;修睦了,,,,,,也能看到测试通过。。。。。。这种反馈闭环清晰、可验证、可沉淀,,,,,,以是 Claude Code、Codex、ZCode、MiniMax Code 都先从代码场景打穿。。。。。。

图片泉源:智谱 Zcode

但代码只是最先。。。。。。研究、表格、PPT、数据剖析、客服工单、法务检索、招聘筛选、运营监控,,,,,,都有类似特征:使命不是一句话能做完,,,,,,但乐成标准可以被写出来,,,,,,历程可以被纪录,,,,,,效果可以被检查。。。。。。

这就是 Loop 的第二层价值:提高重大事情的生产力。。。。。。人不再盯着每一步,,,,,,而是认真定偏向、看效果、改规格。。。。。。吴恩达提到的 developer feedback loop,,,,,,就是说 AI 可以加速内部执行循环,,,,,,但人仍然要在更高一层循环里判断偏向是否对。。。。。。

另外,,,,,,体验欠好的 Agent,,,,,,可能给人的第一印象就是不稳固、乱点工具、越做越偏。。。。。。而从工程角度看,,,,,,Loop 恰恰给了可靠性一个抓手。。。。。。

在 Loop 工程设计下,,,,,, Agent 为什么搜索这个页面,,,,,,为什么修改这个文件,,,,,,为什么挪用这个工具,,,,,,为什么判断使命已经完成,,,,,,这些都可以被纪录下来。。。。。。修复可以酿成 skill,,,,,,项目规则可以写进 AGENTS.md、CLAUDE.md 或类似影象文件。。。。。。下一次 Agent 再做同类使命,,,,,,就不必重新探索。。。。。。

不过,,,,,,这里也要把话说清晰,,,,,,Loop 不会自动带来可靠。。。。。。事实上,,,,,,一个设计很差的 Loop,,,,,,只会让过失更快地自我复制。。。。。。

已往三年,,,,,,我们使用 AI 的方式履历了一再大的转变,,,,,,但底层逻辑没变——都是人发指令,,,,,,AI 执行,,,,,,人再判断效果。。。。。。人一直在循环里,,,,,,是驱动整个系统的焦点。。。。。。Loop 工程第一次把人从循环的中心移到了循环的外面,,,,,,人不再是司机,,,,,,酿成了导航。。。。。。

这个转变的影响会比想象中深远。。。。。。对开发者来说,,,,,,焦点竞争力酿成了界说问题、设计验收标准的能力。。。。。。对产品来说,,,,,,迭代速率会进一步加速,,,,,,倒逼产品团队更懂用户、更懂营业,,,,,,由于手艺不再是瓶颈,,,,,,判断力才是。。。。。。

虽然,,,,,,所有这些都建设在一个条件上:模子还得继续变强。。。。。。Loop 能转几多圈、能处理多重大的使命,,,,,,最终照旧取决于模子的基础能力。。。。。。若是模子跑个三五步就跑偏了,,,,,,那再精巧的 Loop 设计也没用。。。。。。

幸亏从今年的情形看,,,,,,模子前进的速率还没慢下来。。。。。。GPT-5.5、Claude 5、GLM-5.2、M3、K2.6、DeepSeek V4,,,,,,半年时间各家都更新了一代,,,,,,并且每一代都在 Agent 能力上有显着提升。。。。。。

模子越来越强,,,,,,Loop 越转越顺,,,,,,人越来越往外退。。。。。。这个趋势已经很清晰了。。。。。。

这件事听起来似乎只是效率提升,,,,,,但仔细想想,,,,,,它可能是 AI 更进一步从「工具」酿成「协作者」的要害一步。。。。。。工具是你用它,,,,,,你得知道怎么用、每一步怎么操作。。。。。。协作者是你告诉它目的,,,,,,它自己想步伐,,,,,,你们一起把事情做成。。。。。。

我们现在可能正站在这个分界点上。。。。。。

 

文章点评

未盘问到任何数据!

揭晓谈论

◎接待加入讨论,,,,,,请在这里揭晓您的看法、交流您的看法。。。。。。

最新文章

热门文章

随机推荐

【网站地图】