凯时AG

2026-06-14 18:17:39 设为首页 | 加入珍藏

Anthropic万字长文：AI正在成为自己的“造物主”

2026-06-14 18:17:39 宣布泉源：魅族Flyme 作者：郑唬；；萆浏览：3657次

若是你以为AI还只是帮你改改邮件、写写周报的小助手，，那可能有点低估它了。。Anthropic最近把自己家底翻了一遍，，发明一个有点震撼的事实：AI正在成为自己的“造物主”。。

简朴说就是，，以前AI怎么进化，，每一步都得人盯着、人下手。。但现在，，Anthropic越来越多地把AI开发的事情，，直接交给AI自己干。。效果是：工程师每季度合并的代码量，，是已往几年的8倍；；；；凌驾80%的新代码是Claude写的；；；；有些耗时几天的活儿，，它两小时就干完了。。更厉害的是，，AI不但醒目活，，还能做判断。。好比给一个开放的研究问题，，它自己能设计实验、跑效果、找谜底。。在一个AI清静测试里，，两个人类研究员花了一周解决了23%的问题，，Claude用800小时和一万八千美元的算力，，解决了97%。。凭证这个速率，，AI能自力完成的使命时长，，约莫每四个月翻一倍。。去年3月它醒目4分钟的活儿，，今年已经醒目12小时的了。。凭证这个趋势，，2027年左右，，AI可能就醒目人类需要好几周才华完成的事。。虽然，，Anthropic也说了，，这还不是“AI彻底自己造自己”的那一天——但谁人叫“递归式自我完善”的工具，，可能比大大都人想的来得快。。好的一面是，，科学、医疗、生产力可能会被推着跑起来。。欠好的一面是，，若是AI真的能自己造自己，，人类怎么包管还能“管得住”它，，就成了一个天大的问题。。这篇文章有点长，，但值得看完！

以下为编译。。

在 AI 生长史上的大大都时间里，，人类主导了它开发周期中的每一个环节。。但在 Anthropic，，我们正把越来越多的 AI 开发事情委托给 AI 系统自己完成，，而这正在显著加速凯时AG事情速率。。

若是把这一趋势继续推远，，并给予足够多的算力，，它最终会指向一种 AI 系统：它能够完全自主地设计并开发自己的后继版本。。这被称为递归式自我刷新（recursive self-improvement）。。我们还没有走到那一步，，并且递归式自我刷新也并非必定爆发。。但它到来的时间，，可能会比大大都机构准备得更早。。

借助果真基准测试，，以及此前从未对外披露的 Anthropic 内部数据，，Anthropic Institute 正在展示一个事实：AI 已经最先加速 AI 系统自己的开发。。举一个例子：今天，，Anthropic 工程师平均每个季度交付的代码量，，已经是 2021—2025 年时代的 8 倍。。

本文讨论的手艺趋势批注，，未来几年 AI 系统的能力还将大幅提升。。这些趋势意义重大。。能够“构建自己”的 AI，，将会是手艺史上的一个重大节点——它可能像《Machines of Loving Grace》所描绘的那样，，在科学、医疗等领域为天下带来重大的善意与前进。。但完全意义上的递归式自我刷新，，也可能增添人类失去对 AI 系统控制的风险。。若是系统真的具备完全构建厥后继版本的能力，，那么我们怎样包管其清静、怎样监控它、怎样塑造它的行为，，都会变得主要得多。。

来自外部天下的证据

AI 模子提升的速率正在加速。。它们能够可靠自力完成的使命时长，，已经从更早期约莫每七个月翻一倍的趋势，，加速为现在约莫每四个月翻一倍。。2024 年 3 月，，Claude Opus 3 还能完成约莫相当于人类 4 分钟事情量的软件使命。。一年之后，，Claude Sonnet 3.7 已经能处理相当于人类约 1 个半小时的使命。。再过一年，，Claude Opus 4.6 已经能完成 12 小时级别的使命。。[^1] 若是这一趋势延续下去，，那么今年之内，，熟练职员需要花上数天才华完成的使命，，就可能进入 AI 的能力规模；；；；到 2027 年，，AI 系统或许将能胜任那些人类需要数周才华完成的使命。。

同样的模式也泛起在编码与研究基准测试上。。唬；；疾馐匀ê獾氖悄Ｗ釉谀骋惶囟煊蛑械奶逑，，而当模子效果靠近 100% 时，，我们就说该基准被“饱和”了。。[^2] SWE-bench 是现实天下软件工程的标准测试之一：它会给模子一个真实的开源代码库和一份真实 bug 报告，，要求模子写出能修复问题、并通过项目自身测试的代码变换。。仅仅两年时间，，模子就在这个基准上从个位数低分一起走到靠近饱和。。

CORE-Bench 测试的是模子能否复现已有研究效果，，这也是其未来开展原创研究的条件。。测试方式是向 AI 模子提供一篇已揭晓论文背后的代码与数据，，并要求它重新运行所有流程，，确认自己能够复现实验结论。。AI 系统在 2024 年时，，复现乐成率约莫只有 20%；；；；而仅仅 15 个月之后，，这一基准也已趋于饱和。。认真长时使命能力评测的 METR 还发明，，Claude Mythos Preview 已经能够事情“至少”16 小时，，并且已经“触及 [METR] 在不引入新使命条件下可丈量能力的上限”。。

果真基准可以告诉我们许多关于系统能力自己的信息，，但它们无法直接展现 AI 系统事实在多洪流平上加速了 AI 自身的开发。。要回覆这个问题，，我们需要来自 Anthropic 这类 AI 公司内部的一手证据。。

Anthropic 内部的证据

构建一个前沿模子，，大致可分为两类事情。。其一是工程：编写代码、搭建基础设施、监视模子训练。。其二是研究：决议要做哪些实验、诠释实验返回的效果，，并判断接下来该实验哪些想法。。

无论在工程照旧研究上，，泛起出的图景都相当一致。。在工程侧，，Claude 已经能够吸收一个界说并不充分的问题，，然后自行探索解决路径；；；；人类提供的是目的，，但不再需要提供要领。。在研究侧，，Claude 已经可以在执行一个界说清晰的实验时，，抵达甚至凌驾熟练人类研究者的水平。。不过，，在工程和研究中，，Claude 在“选择目的”时所需的判断力上，，依然保存显着能力差别。。这正是今天的 AI 与未来那种可以自主设计自己后继者的系统之间的差别。。

在 Anthropic，，员工通常唬；；崴孀怕睦鎏矶拥皆嚼丛娇拧⒁苍嚼丛街饕氖姑。。初期，，他们执行别人已经界说好的使命，，好比：“导出按钮坏了，，请修一下。。” 随着履历增添，，他们会拿到一个目的，，然后自己设计实现路径，，好比：“视察一下为什么网络在高负载下会变慢。。” 而到了最资深的层级，，他们决议的已经是“什么问题值得做”，，例如：“团队下个季度应该做什么？？？” 我们可以借助 Anthropic 内部数据，，看看 Claude 在应对这些差别类型使命方面已经走到了哪一步。。

Claude 正在编写 Anthropic 相当大比例的代码。。阻止 2026 年 5 月，，Anthropic 代码库中合并进主分支的代码里，，凌驾 80% 出自 Claude。。[^3] 在 2025 年 2 月 Claude Code 研究预览版宣布之前，，这个数字还只是个位数低位。。这种转变也体现在了工程师的人均产出上。。Anthropic 建设最初四年（2021—2024），，每位工程师天天合并的代码行数基本坚持稳固；；；；到了 2025 年，，当 Claude 最先不再只是“建议代码”，，而是直接“运行代码”时，，这条曲线最先向上抬升；；；；到了 2026 年，，模子能够在更长时间跨度上自主事情后，，斜率再次显着变陡。。下面这张图展示了这两个拐点。。到 2026 年第二季度，，典范工程师天天合并的代码量，，已经是 2024 年时的 8 倍。。[^4] 原因很简朴：许多代码已经由 Claude 写出，，而工程师的角色转向了指挥与审阅，，而不是亲手逐行敲写。。

虽然，，需要注重的事：代码行数并不是完善指标，，由于它权衡的是数目而不是质量。。以是，，2026 年第二季度“每位工程师天天 8 倍代码行数”，，险些肯定高估了真实生产率提升的幅度。。但无论怎样，，它说明晰一件事：速率正在加速。。在 Anthropic，，我们并不会凭证“你写了几多行代码”来奖励员工；；；；团队成员之以是产出更多代码，，只是由于他们正在用 AI 系统写出更多代码。。

代码行数的增添，，也与员工对生产率显著提升的主观感受相吻合。。2026 年 3 月，，在 Anthropic 研究团队 130 名员工加入的一项视察中，，受访者中位数预计：在“无论怎样原来也会做的那些项目”上，，使用 Mythos Preview 后，，他们的产出约莫是“完全没有 AI 可用”情形下的 4 倍。。[^5] 我们预计，，3 月时真实的提升幅度可能比这个数字略低。。[^6] 只管云云，，我们依然以为整体结论可信，，也与凯时AG其他视察一致：Anthropic 中相当一部分手艺员工，，正在以没有 AI 资助时数倍的速率完成自己的焦点事情。。

我们还看到一些证据批注，，Anthropic 员工正使用 Claude 去完成那些若是没有 AI，，原来基础不会去做的事情，，好比搭建探索性工具、或者整理那些恒久被弃捐的问题。。举例来说，，2026 年 4 月，，Claude 一次性交付了 800 多个修复，，把某一类 API 过失镌汰到了原来的千分之一。。认真监视 Claude 的工程师预计，，若是让人类来做，，这项事情需要整整 4 年；；；；修别人的 bug 原来就是一件缓慢、繁琐、极其消耗精神的事，，而人类也很难同时在脑中维持云云重大且生疏的上下文。。

“约莫一年前，，我最先很是激进地推进‘Claudifying’。。那是一段很是疯狂的旅程，，而到现在，，或许已经有 5 个月，，我再也没亲手写过任何代码了。。”——Anthropic员工

Claude 写出来的代码是“好的”，，并且还在一连变好。。 “好代码”包括两层寄义：第一，，它能正常事情；；；；第二，，它的写法要让另一位工程师能够明确、并继续在其上迭代。。对第一条标准而言，，证据已经很清晰。。已往一年里，，Anthropic 员工在使命举行历程中对 Claude 举行纠正、重定向，，或直接接受的频率一直在稳步下降，，哪怕是在最重大、最开放的问题上也是云云。。所谓“开放问题”，，是指那些没有明确规格说明、工程师自己也不确定准确谜底长什么样的问题。。下图展示了 Claude 在差别难度使命上的乐成率转变。。Claude 已经能写出真正可运行的代码。。

怎样明确这张图：会话是否乐成，，由一个 Claude 裁判来判断；；；；若是 Claude Code 署理显着完成了用户使命，，并且历程中不需要人为纠正，，则该会话被视为乐成。。事情负载的转变可能导致乐成率泛起短期波动。。

在最开放的那类使命上，，Claude 的乐成率到 2026 年 5 月已经抵达 76%，，在 6 个月内提高了 50 个百分点。。举个这类使命的例子：一次通例升级导致数以万计的训练作业瓦解。。一位工程师险些只给了 Claude 一点文本信息和集群会见权限，，就把实时势故友给它处理。。Claude 一边检查运行中的作业，，一边逐项测试情形设置，，最终锁定了一个触发瓦解的隐藏调试标记位，，乐成稳固复现问题，，并确认相识法。。约莫两小时内，，Claude 完成了通常需要两到三天才华做完的事情。。

第二条标准，，是代码是否写得足够清晰，，让另一位工程师能看懂并在其上继续开发。。在这一点上，，人类与 AI 之间的差别依然保存，，但正在迅速缩小。。Anthropic 内部对此并非完全一致，，但许多人以为：在 2025 年尾，，Claude 写的代码质量仍显着逊于 Anthropic 工程师自己写的代码；；；；而到今天，，两者已经大致持平。。我们预计，，在一年之内，，Claude 写出的代码会更好。。

这也改变了 Anthropic 审查代码的方式。。现在，，提交到代码库中的变换会先由一个自动化的 Claude 审阅器读取，，它会在代码合并之前检查 bug、清静误差以及其他缺陷。。使用这一工具，，我们做了一次回溯剖析，，发明：若是已往对代码库中的每一次改动都举行自动化 Claude 审查，，那么 claude.ai 过往事故背后约莫三分之一的 bug，，原来都可以在进入生产情形之前就被阻挡下来。。写下那些代码的工程师，，自己已经是天下上最善于构建这类系统的人之一。。现在，，Claude 已经能捉住他们遗漏的过失。。

“在 2025 年尾，，Claude 写的代码质量还比 Anthropic 人类工程师写的差一些；；；；今天，，它大致已经抵达一律水平；；；；而我们预计，，在一年内它会严酷意义上凌驾人类。。”——Anthropic员工

Claude 已经很善于围绕别人设定的目的来跑实验。。每次 Anthropic 宣布新模子时，，我们都会举行统一个测试：给 Claude 一段用于训练小型 AI 模子的代码，，要求它在仍通过相同准确性检查的条件下，，把这段代码跑得尽可能快。。目的和评估标准事先就被牢靠好了，，以是 Claude 的使命就是通过改写代码、运行代码、计时，，再重复这一历程来寻找加速要领。。这相当于一个缩小版的实验研究闭环。。2025 年 5 月，，Claude Opus 4 相比起始代码平均实现了约 3 倍加速；；；；到 2026 年 4 月，，Claude Mythos Preview 已经抵达约 52 倍。。作为参照，，一个熟练的人类研究员通常需要 4 到 8 小时，，才华做到 4 倍。。[^7] 在研究流程的这一环——也就是在界说清晰的实验里做方法优化——Claude 在不到一年的时间里，，就从“很是有资助”跨越到了“凌驾人类”。。

“今天的整体形态大致是：人类提出想法，，而模子能以比已往快一个数目级的速率，，把这些想法实现、测试并评估出来。。”——Anthropic员工

Claude 正越来越善于提出自己的实验。。 2026 年 4 月，，Anthropic 宣布了第一个由 Claude 端到端完成开放式研究项目的演示。。研究职员给 Claude 驱动的署理们一个 AI 清静偏向上的开放问题——大致来说，，是“较弱模子是否可以可靠监视较强模子？？？”——然后让它们自己去解决。。这个历程包括提出假设、举行实验、与并行署理共享发明，，并一直迭代。。这个使命有清晰的体现“地板”和“天花板”：地板是弱监视模子单独事情时能抵达的水平；；；；天花板则是强模子在使用准确谜底训练后抵达的水平。。两位人类研究者花了约莫一周时间，，恢复了其中约 23% 的差别；；；；而这些署理累计事情 800 小时、消耗约 1.8 万美元算力后，，恢复了 97%。。虽然，，这项事情也有一些限制：效果并没有顺遂迁徙到生产规模的模子上，，并且问题的选择和评分规则仍然由人类设定。。但在这些界线条件之内，，署理们是自己设计了每一个实验。。人类真正饰演的唯一要害角色，，就是设定研究偏向。。

“Claude 在 1 到 2 天里，，险些没怎么需要我资助，，就把这一切做完了。。我想，，若是一位[初级同事]在同样时间里拿着这样的效果回来找我，，我会感应有点惊喜。。未来已经来了。。”——Anthropic员工

Claude 正越来越善于把研究会话引向真正的研究发明。。我们剖析了 Anthropic 研究职员在 2026 年 1 月到 3 月之间与 Claude 一起事情的真实 Claude Code 会话，，这些会话处理的都是开放式调盘问题，，好比“为什么一次训练运行总是崩掉”，，或者“为什么某个模子在基准测试上得分这么低”。。在每个案例里，，我们都找到了研究员中途“走弯路”的时刻：他们沿着一个过失偏向前进，，导致整个会话偏离正轨，，之后才重新拉回来。。接着，，我们只把“会话偏离之前”的事情内容展示给多个 Claude 模子，，并问它们下一步会怎么做。。然后，，再由另一个能够看到整个会话最终效果的 Claude，，来判断事实是 AI 照旧人类提出了更好的下一步。。[^8]

由于我们有意挑选了这些“人类选择原来就有刷新空间”的时刻（n=129），，以是这并不是模子与人类判断力的一次完全公正比照。。这些时刻真正提供的是一组现实而难题的场景：准确的下一步并不显然，，而人类其时的选择，，恰恰可以作为一个有用的标尺，，来较量模子能力随时间的转变。。凭证这一指标，，我们在 2025 年 11 月体现最好的模子（Opus 4.5），，有 51% 的概率比人类其时的选择更优；；；；到 2026 年 4 月（Mythos Preview），，这一比例上升到 64%。。研究事情的日常，，实质上就是由一连串“下一步该做什么”的决议组成，，因此，，这可以作为权衡模子未来能否自主推进视察研究的一个相关指标。。我们把这一效果视为一个早期信号：AI 系统正在越来越善于做出那些 AI 研究自己所依赖的判断。。

怎样明确这张图：图中的“实践天花板线”代表一种“理想谜底”——它由一个能看到整个会话全历程（包括厥后怎样竣事）的模子写出。。

“阻止现在，，人类的较量优势仍然在于：望见更大的图景，，并且能够跳出眼前使命的界线去思索。。”——Anthropic员工

Anthropic 的事情未来可能会是什么样？？？

这些证据批注，，在 AI 开发流程中的每一步，，人类所饰演的角色都在缩短。。一旦人类与 AI 所写代码的质量抵达一律水平，，人类就会彻底阻止亲自写代码，，而只保存审阅这一职责。。但若是人类审代码的速率赶不上 Claude 天生代码的速率，，那么代码审阅自己就会成为 AI 开发的新瓶颈。。同样，，一旦 Claude 已经能自力跑实验，，问题就会转向：“这些实验里，，哪些值得跑？？？” 说得更直接一些：现在，，“执行”——也就是写代码、跑实验、产出效果——险些已经不再消耗人类时间，，只管它仍然消耗算力。。

至少在现在，，人类的较量优势仍在于研究品味与判断力：包括哪些问题主要、哪些效果可信，，以及什么时间该认定一条路径已经走进死胡同。。

“事情（以及生涯）一经建设在一种由人与人之间小资助组成的‘礼物经济’上。。‘你能帮我把这个剧本跑起来吗？？？’……每一次请求都会形成一点点人情债，，也会增添一点点相互之间的感知。。[Claude] 更快，，并且不会制造任何人情债，，但每一次这样的替换，，也意味着一次人类协作时机的流失。。”“在一切都运转顺遂的日子里，，我会忍不住以为我做什么都不主要，，一切都自动化了，，并且比我更快、更好。。但也有些日子，，一切突然都坏掉了，，我又基础不知道为什么，，于是我意识到，，自己已经完全不知道这些天事实在做什么了。。”——Anthropic员工

若是我们错了呢？？？

对上面这些证据，，一个很自然的反驳是：真正最主要的事情，，仍然掌握在人类手里——也就是决议“该做什么问题”。。若是没有这种判断力，，Claude 充其量只是一个能力很强的助手，，而不是一个能够自己推动 AI 前进的系统。。

今天的训练要领和模子架构，，事实能否解锁这种能力，，确实还很不明确。。但 AI 的前进很少来自那种“灵光一现”的顿悟时刻。。近年 AI 历史中确实泛起过一些这样的时刻，，好比 Transformer 架构，，或者混淆专家（mixture-of-experts）模子；；；；但真正改变范式的想法，，往往几年才泛起一次。。在这中心，，大部分前进着实都很“质朴”：把某个工具继续放大，，看看那里出问题，，修掉，，再试一次。。而这恰恰正是 Claude 现在最善于的事情流。。爱迪生说，，天才是 1% 的灵感加上 99% 的汗水。。而我们看到的是，，“汗水”这一部分正在越来越自动化。。越来越显着的一点是：推动前沿向前走的许多事情，，自己就是可自动化的；；；；大规模研究希望，，在很洪流平上取决于工具和资源——它们决议了你能多快跑实验、一次能跑几多实验，，以及你能多快拿到效果。。

即便我们假设 Claude 永远也得不到真正好的研究品味，，对现有证据做一个守旧解读，，也仍然意味着一种“复利式加速”。。若是人类把大部分时间都花在谁人位数比例的“偏向设定”事情上，，而剩余部分都交给 Claude 来做，，那么每位工程师或研究者现实上都在同时驾驭比已往多得多的事情量。。我们看到的证据批注，，Anthropic 的员工不但移动得更快，，也笼罩了更广的事人情。。在现实层面，，这意味着：自从有用的 AI 工具泛起之后，，AI 已经让 Anthropic 的推进速率比已往快得多。。

而一种没那么守旧的解读则是：只管现在证据还很起源，，但 Claude 在研究判断力上的提升，，也许说明这项能力自己也在前进。。“研究品味”也许只是另一种典范的 AI 能力：系统会先在一段时间内体现得很差，，然后突然最先变得善于。。类似的模式，，我们已经在其他更偏定性的能力上见过，，好比 AI 系统最先能够诠释一个笑话为什么可笑、展现“心智理论”，，或者解开语言谜题。。

可能的未来

接下来会爆发什么，，取决于两件事：第一，，这条趋势会不会继续；；；；第二，，若是继续，，我们会选择做什么。。我们至少可以想象三种未来情景：

1. 趋势障碍，，但今天的 AI 能力普遍扩散

这篇文章里泛起了许多指数型轨迹。。但这些轨迹也可能最终只是 S 曲线。。我们可能正靠近曲线的弯折点：规模唬；；乇ㄗ钕鹊菁，，增添线条先变直，，再趋于平缓。。一个“及格研究员”和“伟大研究员”之间的差别，，所依赖的那种判断力，，也许并不可通过继续扩大训练输入（如算力和数据）来获得。。若是真是这样，，那么要越过这一瓶颈，，就需要一个新想法，，好比一种能够取代目今所有前沿模子所依赖的 Transformer 的新架构蹊径。。

另外，，限制 AI 希望的要害约束，，也可能不在模子自己，，而在供应链：前沿能力的推进与扩散，，也许需要比当宿天下可提供的更多能源和算力。。制芯速率、电网扩容、互连带宽，，也许才是真正的约束，，而不是智能自己。。我们也不可扫除某种外生攻击对 AI 生态造成突然减速的可能，，好比算力或电力供应蓦地缩短——无论哪一种，，都会让前进变慢，，也让前沿实验室继续投入的本钱上升。。唬；；蛘，，也可能保存其他我们尚未预见到的障碍。。

纵然把模子能力冻结在今天的水平，，我们仍然预计天下会爆发重大转变。。Project Glasswing 就是一个早期信号：在最初几周里，，Mythos Preview 在全球最主要的一些系统中发明了凌驾一万个高危和严重级别的软件误差，，多到网络防御的瓶颈已经从“发明误差”转向“来缺乏修补误差”。。并且，，我们仍处在今天这些模子向更普遍经济系统扩散的早期阶段——未来，，一个 100 人的公司，，越来越可能做出已往 1000 人公司才华完成的事情，，由于每一位员工死后都将站着一个署理金字塔。。

之以是把这个情景列出来，，是为了完整性；；；；但我们并不以为它最有可能爆发。。到现在为止，，我们能丈量到的所有能力——包括那些看起来更“软”、更难量化的能力，，好比代码质量和开放使命乐成率——都遵照着同样的上升曲线。。我们还没有看到这条曲线最先弯折。。在我们讨论的三种未来里，，这一种会给政府和社会最多的顺应时间。。相比之下，，我们更担心后面两种，，由于它们会来得更快，，留给准备的空间也小得多。。

2. AI 实验室继续获得复利式效率提升

在这个情景里，，AI 开发将实现相当水平的自动化，，但研究偏向仍由人类设定，，效果也仍由人类裁定。。使用 AI 系统的组织会随着时间推移变得越来越高效，，因此我们可以预期，，每一个组织成员的生产力都会被成倍放大。。一个 100 人的公司，，可能做出 1 万人甚至 10 万人组织才华完成的事情。。这将彻底刷新知识事情和政府服务，，但它同样可能被用于有害目的：从针对整个人群的威权监控，，到为每个个体量身定制、且以任何人工团队都无法匹敌的规模运行的影响力操控。。届时，，在 Anthropic 这样的公司里，，人类的角色也会改变。。人们将与 AI 系统协作，，放大研究能力、天生新洞见，，并配合建设那些用来验证 AI 输出是否可信的系统。。

我们在这里展示的证据批注，，我们很可能正在走向这个情景。。但一个流程中某一环节的提速，，往往只是把瓶颈推到了别处：整体速率终究受制于那些还没有加速的部分。。在盘算机科学中，，这叫阿姆达尔定律（Amdahl’s law），，对组织同样建设。。Anthropic 已经遇到了阿姆达尔定律的一个典范体现：随着组织内代码流动速率越来越快，，人类代码审查已经成为新的瓶颈。。

而这种摩擦并不但保存于工程侧。。Anthropic 员工与高能力模子协作后，，新的想法、妄想、工具和模拟实验泛起了爆炸式增添，，多到我们基础没有足够能力去逐一推进。。一个组织能多快发明并修复这些新瓶颈，，也许会成为一种会随着时间一连进化的能力，，并最终成为任何组织最主要的能力。。

3. AI 系统自己获得完全递归式自我刷新能力，，并最先构建它们的后继者

若是手艺能力继续沿着目今趋势前进，，而 AI 系统又获得了那种属于“厘革性人类创立力”的能力，，那么 AI 系统设计并优化自身的可能性就是现实保存的。。

在这个天下里，，AI 开发进度将完全由算力的可获得性决议——或者说，，由 AI 系统自己发明训练或推理算法效率提升的速率来决议。。人类在开发中的角色将大幅缩小，，可能把大部分精神转向对一个一直扩张的、由 AI 系统运行的“虚拟实验室”举行监视、验证与核查。。我们预计，，一旦系统具备自动化 AI 研究与开发的能力，，这些手艺也会转移到其他科学领域，，从而最先改写更多学科的生长方式。。

在这种未来里，，对齐问题事实会被怎样解决——或者基础解决不了——是我们最没有掌握的部分。。模子可能足够对齐，，同时也具备足够好的研究品味，，以至于能自行发明并实现我们尚未抵达的新解决方案；；；；它们甚至也可能足够“明智”，，在发明条件缺乏时自动阻止生长。。另一种可能则是，，今天模子中无意泛起的失配问题，，会随着模子一直构建厥后继者而一直累积，，变得越来越频仍、却越来越难以明确，，直到我们最终失去控制。。也有可能，，我们根原来缺乏建设、整合并验证那些资助我们判断自己事实正处在哪条轨道上的工具。。

我们对这个天下会长什么样没有优异直觉，，由于今天的经济仍由人类和人类制造的工具驱动。。而从界说上说，，一个由快速递归式自我刷新驱动的天下，，可能会被这种能一直自我增强的模子所主导：随着它的能力周全逾越人类，，并在整个经济中扩散，，天下将爆发基础转变。。若是人类劳动不再具有竞争力，，我们很难展望那时的经济会是什么样子。。

纵然模子开发真的实现了完全自动化与递归化，，我们仍无法展望这对大大都人的日常生涯事实意味着什么。。阿姆达尔定律在这里同样适用。。递归式智能可能会在某些领域迅速实现《Machines of Loving Grace》中提到的许多利益。。我们预计，，具身智能（也就是机械人）可能会很快跟上递归式智能，，并沿着类似路径，，以更低本钱获得越来越高的回报。。更强盛的智能，，也许会资助我们更快地制作现实天下中的系统，，开展更高效的救命药物临床试验，，生长新的协调机制。。

但仅仅实现递归式刷新，，并不料味着工业生产方式、社会组织方式或市场运行方式会连忙改变。。更强的智能无法让我们在几天内望见一种药物几十年后的恒久副作用，，无法让选举早于宪规则定的时间举行，，也无法在一个周末之内把生疏人酿成老朋侪。。对大大都人而言，，这种未来的“体感速率”仍将由瓶颈决议——即便上游实验室已经在以算力的速率奔驰。。递归式智能一连越来越快地构建自身，，而另一边的人类天下仍受制于关系、治理和制度的节奏；；；；这两者碰撞出的未来，，也是我们无法展望的部分。。

我们应该做什么？？？

若是有可能有用放慢这项手艺的生长，，为社会争取更多时间去应对它所带来的重大影响，，我们以为这或许率会是一件好事。。但若是“放慢”只是让那些最不审慎的加入者在手艺上遇上来，，那反而可能使所有人更不清静。。在缺乏全球协调机制的情形下，，企业和政府都将不得不在竞争压力和地缘政治压力下，，艰难地做出清静相关决议。。

我们以为，，天下若是拥有“减速”或“暂时暂停”前沿 AI 开发的选项，，会是一件好事——这样，，社会制度建设和对齐研究才有时机跟上手艺前进的速率。。Anthropic Institute 将与许多其他机构相助，，开展研究并接纳行动，，资助建设一种真正可信的减速或暂停唬；；扑匦璧南低。。这些系统应当使前沿 AI 开发者能够验证：全球其他加入者确实也已经阻止或放慢了脚步，，同时也能确保唬；；敌形卟换峤栌伞靶骷跛佟钡拿逋低导铀倭煜。。若是这样的系统保存，，我们预计：只要其他位于前沿或靠近前沿的开发者也在可验证条件下接纳了同样行动，，我们会愿意放慢甚至暂时暂停。。

一次有意义的减速或暂停，，要求多个资源雄厚、处在前沿或靠近前沿的实验室，，分处多个国家，，并在同样条件下赞成停下；；；；同时，，还要求各方都能验证其他方确实停下了。。由于 AI 系统自己的奇异特征，，这一军控问题中的“可探测性”（detectability——标准低于“可验证性”）比其他手艺难题堪多。。训练运行比导弹发射井更容易隐藏，，它们的输入也都是通用型资源，，而偷偷违约的激励又极其强烈——由于当别人暂停时，，谁继续推进，，谁就可能继续领先职位。。一个可信的暂停唬；；苹贡匦杳魅罚菏裁创シ⒃萃，，什么条件下扫除暂停，，以及由谁来裁定。。

从原则上说，，这并纷歧定不可能。。人类社会一经为其他重大手艺建设过验证机制，，好比《中导条约》（Intermediate-Range Nuclear Forces Treaty）。。但那类机制用了几十年才建设起基础设施与互信。。我们已经没有那么长时间了。。相比之下，，由单个实验室单方面暂停，，今天连忙就可以做到，，但作用小得多：它只会改变谁是领跑者，，却无法创立目今真正缺失的、更普遍的社会性讨论历程。。

未来几个月，，我们将组织一系列讨论，，让政策制订者、研究职员、公民社会以及其他 AI 公司，，一起回覆本文提出的一些问题，，尤其是关于完全递归式自我刷新，，以及如作甚协调与审议创立更好选项的问题。。我们也会把这些讨论的效果宣布出来。。现在，，正是一起研究这些问题的窗口期，，而 AI 公司之外的人，，也应当被纳入这场讨论。。

Marina Favaro 和 Jack Clark 配合撰写了本文，，Santi Ruiz 提供编辑支持。。Shan Carter、Romello Goodman 和 Nikki Makagiansar 基于 Brian Calvert 与 Jun Shern Chan 网络的数据制作了文中视觉内容。。Daniel Freeman、Jim Baker、Max Young、Sarah Pollack、Francesco Mosconi、Holden Karnofsky、Andy Jones、Kevin Troy、Anton Korinek、Meg Tong、Andrew Ho、Dan Altman、Drake Thomas、Jack Shen、Sasha de Marigny 和 Avital Balwit 提供了反馈。。

[^1]: METR 的要害权衡指标，，是 AI 系统在一组使命上抵达 50% 可靠性时所对应的使命时长；；；；不过，，即便使用 80% 可靠性标准，，趋势线看起来也险些一样。。

[^2]: 尤其当基准越来越偏向开放式名堂和更难题使命（例如奥数级数学问题）时，，由于问题与谜底集自己可能保存歧义、问题无法求解等问题，，基准往往会在低于 100% 的位置就“饱和”。。

[^3]: Anthropic 治理层曾果真预计，，我们凌驾 90% 的代码都是由 Claude 写的，，这其中包括剧本和实验性代码。。本文所说的 “>80%”，，指的是合并进生产情形的代码行中，，可归因于 Claude 的占比。。这个指标更守旧，，体现在两方面：一是凯时AG归因流程自己保存缺口；；；；二是那些未被归因给 Claude 的代码行中，，也包括自动天生代码和其他并非人类手写的内容。。

[^4]: 这轮代码产量激增，，正在挤压各人共用的基础设施。。作为全球大部分软件构建的平台，，GitHub 在整个 2025 年约莫纪录了 10 亿次代码提交；；；；而到 2026 年年中，，这一数字已经酿成每周 2.75 亿次，，按整年速率估算约莫会抵达 140 亿次。。GitHub 首席运营官体现，，公司正“极其起劲地”扩容，，仅仅为了跟上这个增添速率。。

[^5]: 关于这项视察的要领学细节，，可拜见 Claude Opus 4.7 System Card 的第 2.3.5 节。。

[^6]: 许多受访者可能并未仔细思量应怎样校正这个问题中的种种误差或界说细节，，而 METR 最近的研究显示，，开发者对 AI 带来生产率提升的主观预计，，往往会高于现实值。。

[^7]: 详细加速能抵达多洪流平，，很洪流平上取决于起始代码自己还留有几多优化空间，，因此这里的绝对倍数不应被直接解读为现实天下中的训练加速效果。。更有信息量的是这种“同条件比照”所提供的较量：差别模子之间（已往一年从约 3 倍到约 52 倍）以及模子与熟练人类之间（在同样使命上，，人类 4 到 8 小时做到约 4 倍）的差别。。

[^8]: 为了检查裁判偏置，，我们还在另一组 127 个时刻上做了同样测试；；；；这些时刻里，，人类其时的下一步原来就已经很强（与原始测试集“人类偏向保存刷新空间”差别）。。在这组比照中，，模子给出的建议只有约莫 20% 的情形下被判断为更优。。

点个“爱心”，，再走吧

光是相识这些还不敷，，我们还梳理了火疖子的主要特点：

责任编辑：黎乃文校对：骆协美

今日热门

相关推荐

【网站地图】