彻底杀死提醒词角逐,,,,Agent Loop是什么鬼??
2026-07-03 17:47:03 宣布
泉源:站长下载
作者:谢佩任
浏览:6385次
昨天小雷刷到吴恩达在 X 上的一篇推文,,,,讲的是 Agent 的 Loop(循环)工程。。。。。。
图片泉源:X
若是你最近半年用过 Claude Code、Codex、Workbuddy、Kimi Work 或者其他 Agent 产品,,,,你可能已经感受到了那种转变——相比已往一句一句教 AI 干什么,,,,现在你把需求扔进去,,,,它自己会写、会跑、会报错了自己改,,,,直到把工具做出来。。。。。。
这种「自己转起来」的感受,,,,就是 Loop 工程在 Agent 产品上的落地。。。。。。
「……你不应再给 Coding Agent 写提醒词了,,,,你应该设计 Loop。。。。。。」6 月,,,,OpenClaw(龙虾)首创人 Peter Steinberger 一条推引起大宗的讨论。。。。。。事实上,,,,就在这之前不久,,,,Google 工程认真人 Addy Osmani 系统性整理 Loop 这个看法,,,,提出了 Loop 工程。。。。。。
图片泉源:X
不过从果真信息来看,,,,最早提出 Loop 的人,,,,也是最早让它发光发热的 Claude Code 首创人 Boris Cherny。。。。。。就在 6 月尾,,,,Anthropic 还发了篇博客,,,,把 Claude Code 里的四种 loop 原语所有果真。。。。。。
一个月的时间,,,,Loop 工程基本完成了一次华美的转身,,,,不但是行业共识,,,,也成为了主流的焦点。。。。。。以是,,,,究竟什么是 Loop??对我们通俗用户又有什么影响??
从提醒词到 Harness 和 Loop,,,,Agent 究竟多了什么??
已往讲 AI 使用,,,,绕不开提醒词。。。。。。你让模子写代码、改文档、做研究,,,,提醒词写得越细,,,,效果越像样。。。。。。从模子走向 Agent,,,,模子不但要回覆,,,,还要知道什么时间读文件、什么时间跑下令、什么时间查网页、什么时间停下来问人,,,,提醒词工程、头脑链基础不敷用。。。。。。
以是泛起了 Harness 工程。。。。。。它可以明确成模子外面那套运行框架,,,,认真接工具、管权限、塞上下文、存状态。。。。。。模子照旧认真推理和天生,,,,但它最先被放进一个能执行使命的情形里。。。。。。
Loop 工程又往前走了一步,,,,它体贴怎么让 Agent 围绕一个目的一直「循环」运作。。。。。。
「龙虾」官方文档将 Loop 视为「基础」,,,,图片泉源:OpenClaw
简朴来说,,,,用户给出目的,,,,Agent 先明确使命,,,,再拿上下文,,,,挪用工具,,,,视察效果,,,,判断有没有完成;;;;;;没完成,,,,就继续改,,,,继续跑,,,,继续检查。。。。。。这个历程看起来像人类事情的日常:先做一版,,,,发明问题,,,,再修一版,,,,直到效果能交付。。。。。。
以是 Loop 的重点不在「循环」这个词自己,,,,而在循环里究竟放了什么。。。。。。
Claude Code 的例子最典范。。。。。。它不是简朴把 Claude 接到终端,,,,而是让模子在一个 while-loop 里重复挪用工具、编辑文件、运行下令、视察返回效果。。。。。。真正重大的部分反而在循环外面:权限系统、上下文压缩、插件、skills、hooks、子 Agent、会话存储。。。。。。
Agent 能不可自己转起来,,,,靠的不是模子一时兴起多想几步,,,,而是一整套工程设计托着它往前走。。。。。。
这也是吴恩达这次谈 Loop 工程的焦点配景。。。。。。到了 2026 年,,,,Claude Code、Codex、ZCode、MiniMax Code,,,,Agent 产品已经再把「写—跑—看效果—再改」酿成默认能力。。。。。。
Anthropic 在博客中还把 Loop 分成四种:turn-based(回合制)、goal-based(目的驱动)、time-based(准时触发)、proactive(自动式)。。。。。。
- 「帮我写个登录页面」,,,,它写、测、改,,,,这就是goal-based loop;;;;;;- 你每发一条新闻它回一条,,,,这是 turn-based;;;;;;- time-based 是你可以让它每隔两小时自动去检查某个PR,,,,有更新就帮你 review;;;;;;- proactive 更激进,,,,它会自己发明问题、自己开干,,,,好比发明测试笼罩率下降了,,,,自己去补测试用例。。。。。。
目的驱动 Loop,,,,图片泉源:Anthropic
而这波讨论在 5、6 月突然变热,,,,也和产品希望有关。。。。。。OpenAI 的 Codex 已经不但是「帮你写代码」的入口,,,,而是在自力情形里读客栈、改文件、跑测试,,,,再把日志和效果交回来。。。。。。
Anthropic 这边,,,,Claude Code 自己险些成了 Loop 工程最好的样板。。。。。。Boris Cherny 那句「不再自己写提醒词,,,,而是让一个 Agent 去提醒 Claude」,,,,听起来有点绕,,,,但意思着实就是人不再认真每一步怎么问模子,,,,人认真设计让模子一连事情的机制。。。。。。
这也是 Loop 工程真正值得通俗用户体贴的地方。。。。。。Loop 工程做得越好,,,,Agent 越像一个能接住使命的人:你给它偏向,,,,它自己往前跑;;;;;;跑偏了,,,,它能从反馈里拉回来;;;;;;做完了,,,,它还会把历程和效果交给你检查。。。。。。
杀死提醒词,,,,对咱们通俗人究竟有什么用??
Agent Loop 对通俗用户最直接的价值,,,,就是降低提醒词设计门槛。。。。。。
已往用 AI,,,,很像在和一个智慧但没履历的实习生相助。。。。。。你得告诉它每一步怎么做,,,,什么时间停,,,,那里需要查资料,,,,那里不可乱编。。。。。。你指挥得越细,,,,它体现越好;;;;;;你说得越粗,,,,它越容易跑偏。。。。。。
Loop 做得好的 Agent,,,,更像一个已经知道基本事情流程的人。。。。。。你也不必每次提醒它「若是代码报错就继续修」,,,,由于测试和返工原来就是循环的一部分。。。。。。你甚至不必把所有上下文一次性塞进对话框,,,,由于 Agent 可以通过文件系统、搜索工具、影象和索引自己逐步拿到需要的信息。。。。。。
这会改变用户和 AI 的关系。。。。。。
以前用户在写提醒词时,,,,经常要饰演产品司理、项目司理、测试工程师和先生。。。。。。你要给需求、拆方法、盯进度、改过失。。。。。。以后用户更像是在设目的和验收效果。。。。。。
好比你让一个 Agent 做旅行妄想。。。。。。已往你可能要写:预算几多、天数几多、先查机票、再查旅馆、注重交通、给我表格、最后总结。。。。。。Loop 做好以后,,,,你只要说「下个月去东京 5 天,,,,预算中等,,,,想少折腾,,,,多看展」,,,,Agent 就应该能自己查时间、比价钱、排蹊径、发明冲突、给出方案,,,,还能在你反馈「第二天太满」之后自动重排。。。。。。
这就是「杀死提醒词角逐」的第一层寄义。。。。。。通俗用户不再需要把自己训练成提醒词工程师,,,,Agent 产品应该替用户吸收重大流程。。。。。。
另一方面,,,,软件工程自然适合 Loop。。。。。。目的可以写成 issue,,,,历程可以拆成文件修改,,,,工具可以跑测试,,,,效果可以用 diff 和 CI 验证。。。。。。一个 Agent 写错了,,,,系统马上能看到报错;;;;;;修睦了,,,,也能看到测试通过。。。。。。这种反馈闭环清晰、可验证、可沉淀,,,,以是 Claude Code、Codex、ZCode、MiniMax Code 都先从代码场景打穿。。。。。。
图片泉源:智谱 Zcode
但代码只是最先。。。。。。研究、表格、PPT、数据剖析、客服工单、法务检索、招聘筛选、运营监控,,,,都有类似特征:使命不是一句话能做完,,,,但乐成标准可以被写出来,,,,历程可以被纪录,,,,效果可以被检查。。。。。。
这就是 Loop 的第二层价值:提高重大事情的生产力。。。。。。人不再盯着每一步,,,,而是认真定偏向、看效果、改规格。。。。。。吴恩达提到的 developer feedback loop,,,,就是说 AI 可以加速内部执行循环,,,,但人仍然要在更高一层循环里判断偏向是否对。。。。。。
另外,,,,体验欠好的 Agent,,,,可能给人的第一印象就是不稳固、乱点工具、越做越偏。。。。。。而从工程角度看,,,,Loop 恰恰给了可靠性一个抓手。。。。。。
在 Loop 工程设计下,,,, Agent 为什么搜索这个页面,,,,为什么修改这个文件,,,,为什么挪用这个工具,,,,为什么判断使命已经完成,,,,这些都可以被纪录下来。。。。。。修复可以酿成 skill,,,,项目规则可以写进 AGENTS.md、CLAUDE.md 或类似影象文件。。。。。。下一次 Agent 再做同类使命,,,,就不必重新探索。。。。。。
不过,,,,这里也要把话说清晰,,,,Loop 不会自动带来可靠。。。。。。事实上,,,,一个设计很差的 Loop,,,,只会让过失更快地自我复制。。。。。。
已往三年,,,,我们使用 AI 的方式履历了一再大的转变,,,,但底层逻辑没变——都是人发指令,,,,AI 执行,,,,人再判断效果。。。。。。人一直在循环里,,,,是驱动整个系统的焦点。。。。。。Loop 工程第一次把人从循环的中心移到了循环的外面,,,,人不再是司机,,,,酿成了导航。。。。。。
这个转变的影响会比想象中深远。。。。。。对开发者来说,,,,焦点竞争力酿成了界说问题、设计验收标准的能力。。。。。。对产品来说,,,,迭代速率会进一步加速,,,,倒逼产品团队更懂用户、更懂营业,,,,由于手艺不再是瓶颈,,,,判断力才是。。。。。。
虽然,,,,所有这些都建设在一个条件上:模子还得继续变强。。。。。。Loop 能转几多圈、能处理多重大的使命,,,,最终照旧取决于模子的基础能力。。。。。。若是模子跑个三五步就跑偏了,,,,那再精巧的 Loop 设计也没用。。。。。。
幸亏从今年的情形看,,,,模子前进的速率还没慢下来。。。。。。GPT-5.5、Claude 5、GLM-5.2、M3、K2.6、DeepSeek V4,,,,半年时间各家都更新了一代,,,,并且每一代都在 Agent 能力上有显着提升。。。。。。
模子越来越强,,,,Loop 越转越顺,,,,人越来越往外退。。。。。。这个趋势已经很清晰了。。。。。。
这件事听起来似乎只是效率提升,,,,但仔细想想,,,,它可能是 AI 更进一步从「工具」酿成「协作者」的要害一步。。。。。。工具是你用它,,,,你得知道怎么用、每一步怎么操作。。。。。。协作者是你告诉它目的,,,,它自己想步伐,,,,你们一起把事情做成。。。。。。
我们现在可能正站在这个分界点上。。。。。。
黄心宇坦言,,,,目今,,,,立异药研发加速突破。。。。。。去年,,,,国家药监局批准上市的一类立异药品数目抵达76个,,,,部分药品在同领域同靶点的同质化竞争强烈。。。。。。医保谈判所支持的立异,,,,必需是能够体现临床疗效的真立异。。。。。。
责任编辑:王致远 校对:沈轩臻