Anthropic呼吁按下AI暂停键？| AI自我改进RSI | 真实动机 | 80%代码Claude编写 | 人均每日合并PR达8倍 | 代码成功率76% | 自主修复bug

大家好，这里是最佳拍档，我是大飞 AI最前沿的公司竟然第一个想要按下AI的暂停键？2026年6月5日的凌晨 Anthropic在官方博客发布了一篇标题为《当AI开始建造自己》的长文这篇文章发布仅仅十几个小时全球浏览量就已经超过1000万几乎所有科技圈、投资圈、政策圈的人都在疯狂转发和讨论

这篇文章由Anthropic的联合创始人杰克·克拉克（Jack Clark）以及公司内部研究机构的负责人玛丽娜·法瓦罗（Marina Favaro）共同署名文章的核心观点用一句话就能说清楚 AI正在以超出所有人预期的速度参与到自身的开发进程当中如果这个趋势继续发展到极端未来的某一天

AI将能够在完全没有人类介入的情况下自主设计、自主测试、自主训练出比自己更强大的下一代AI 基于这个判断 Anthropic向全球所有主要的AI实验室发出了一个史无前例的呼吁请考虑暂停前沿AI的开发

或者至少一起建立一套可以互相核查的减速机制听到这里可能很多朋友第一反应会觉得很奇怪因为就在这篇文章发布的前几天 Anthropic刚刚完成了最新一轮的融资公司估值直接冲到了9650亿美元正式超过了OpenAI 成为了全球估值最高的私营AI公司而且就在同一周

Anthropic已经向美国证券交易委员会秘密递交了S-1注册声明草案正式启动了IPO的筹备流程更夸张的是它的营收数据 Anthropic的年化营收正在以一种近乎爆炸的速度增长 2025年底的时候还只有大约90亿美元短短半年时间现在已经攀升到了接近470亿美元预计到这个月底

就会突破500亿美元大关一家在商业上势头如此迅猛马上就要登陆公开市场即将迎来自己商业巅峰的公司对着整个行业喊，大家慢一点我们先停一停这怎么看都显得非常违和甚至有点匪夷所思也正因为如此，这篇文章发布之后

立刻就引发了关于Anthropic真实动机的巨大争议有人说这是Anthropic作为行业领先者的责任和担当也有人说这是它为了巩固自己的垄断地位故意抬高行业门槛的商业手段不过在我们深入讨论这些动机之前还是先来了解一下这篇文章本身其中的大量内部数据正在向我们揭示一个越来越清晰

也越来越让人感到不安的趋势 AI研发的自动化已经不再是科幻小说里的情节也不是遥远未来的可能性它正在我们眼前发生首先我们要明确一个核心概念那就是这篇文章从头到尾都在围绕的“递归自我改进”（Recursive Self-Improvement 简称RSI）这个概念其实并不是什么新鲜东西

早在几十年前人工智能的先驱们就已经提出过这个想法简单来说递归自我改进指的就是AI系统能够自主完成设计、测试、训练下一代AI的完整流程在这个过程中人类不再扮演任何关键角色一旦这个闭环形成

AI的能力提升就会进入一个自我加速的循环它的进步速度会越来越快快到人类根本无法理解和跟上的程度在过去很长一段时间里递归自我改进都被认为是一个非常遥远的理论概念很多人甚至觉得它可能永远都不会实现但是就在过去的这一年里情况发生了根本性的变化几乎所有的头部AI公司

都开始把大量的资源投入到这个方向 AI研发自动化正在快速成为整个行业的共识我们先来看OpenAI 作为目前全球最受关注的AI公司 OpenAI早就已经把AI参与AI研发列入了公司的最高优先级事项它的安全团队专门设立了递归自我改进准备（Recursive Self-Improvement

Preparedness）相关的岗位这些岗位的核心任务就是研究当AI能够显著加速自身研发的时候可能会带来什么样的能力跃迁以及我们需要提前做好哪些准备来应对潜在的风险 OpenAI此前也公开透露过他们的内部目标

在2026年前后打造出能够达到研究实习生水平的AI系统而到2028年他们希望实现能够独立承担完整研究任务的自动化AI研究员再来看谷歌DeepMind 它走的是一条更偏向算法发现的技术路线 DeepMind的AlphaEvolve 就是让AI自主提出算法方案、自主运行实验、自主筛选结果

然后再把筛选出来的优秀方案反馈回系统进行下一轮的迭代目前这套系统已经被应用到了很多实际场景中比如谷歌数据中心的调度优化以及AI训练效率的提升根据报道 AlphaEvolve甚至找到了56年来首个对斯特拉森（Strassen）矩阵乘法算法的改进从某种意义上来说

这也是谷歌DeepMind对“奇点”判断的重要依据之一当AI开始参与、甚至推动新的科学发现和算法创新的时候技术进步就会进入一个前所未有的加速循环除了这些头部巨头之外越来越多的创业公司也开始围绕自动化AI研发这个方向进行布局

比如由田渊栋参与创立的Recursive Superintelligence公司还有把构建擅长AI研发的系统直接写入公司使命的Mirendil 都是这个趋势的典型代表虽然这些公司选择的技术路径各不相同但是它们瞄准的都是同一个终极目标让AI从一个辅助人类研发的工具变成研发过程的核心参与者

并且最终承担越来越多甚至是全部的研发工作正是在这样一个全行业都在疯狂加速的大背景下 Anthropic发布了这篇长文它在文章中明确表示递归自我改进目前还没有发生也不一定会必然发生但是它到来的速度可能比大多数机构准备好的时间要快得多那么问题来了

AI现在到底已经在多大程度上接管了AI研发呢？

Anthropic在文章中公布了三组此前从未对外公开过的内部数据第一组数据是关于AI的代码能力截至2026年5月 Anthropic合并到生产代码库中的代码

有超过80%是由Claude编写的对比一下在2025年2月Claude Code正式上线之前这个比例还只是个位数也就是说仅仅用了一年零三个月的时间 Claude就从一个几乎不会写生产代码的AI 变成了Anthropic代码库的主要贡献者与之对应的是工程师生产力的巨大提升

2026年第二季度 Anthropic工程师人均每天合并的代码量达到了2024年的8倍当然，文章也专门补充说明代码行数衡量的只是代码的数量而不是代码的质量，所以8倍这个数字很可能高估了真实的生产力提升但是无论如何这个趋势是非常清晰的工程师的角色正在发生根本性的转变

从过去那个亲自写代码的执行者逐渐变成了给AI指引方向

而且更重要的是 Claude写的代码质量还在以非常快的速度提升 Anthropic内部一直在跟踪一个指标那就是工程师在使用Claude Code工作的过程中需要纠正AI的错误或者中途接管任务的频率这个频率在过去的一年里一直在持续下降到2026年5月

Claude处理最高难度开放式任务的成功率已经达到了76%，而在六个月之前这个数字还只有26%，短短半年时间就上升了50个百分点第二组数据涉及了AI的科研能力 Anthropic有一个内部的基准测试测试的方法很简单给Claude一段训练小型AI模型的CPU代码

要求它在不改变代码正确性的前提下尽可能地提升运行速度 2025年5月的时候当时最先进的Claude Opus 4模型在这个测试中的平均加速比大约是3倍而到了2026年4月最新的Claude Mythos Preview模型这个数字已经达到了大约52倍

对比一下，一名熟练的人类AI研究员通常需要花费四到八个小时的时间才能让这段代码达到大约4倍的加速虽然Anthropic特别提醒这个绝对加速倍数会受到起始代码本身优化空间的影响不应该把它直接解读为真实世界中AI训练速度的提升倍数但是仅仅一年的时间这个倍数的提升也足够值得我们重视了

第三组数据来自于日常的工程实践 2026年4月 Claude自主修复了超过800个API错误并且将该类错误的发生率降低了约1000倍负责这个项目的工程师估计如果同样的工作交给人类来做大概需要四年的时间才能完成为什么会有这么大的差距呢？

因为修复别人写的Bug 本来就是一个非常漫长而痛苦的过程人类很难同时记住那么多不熟悉的代码上下文也很难在短时间内排查出所有可能的问题但这类任务恰恰是AI的优势所在它可以在极短的时间内阅读和理解整个代码库并且系统性地找出所有潜在的错误

除了这三组核心数据之外文章还公布了一个非常有意思的实验 2026年4月 Anthropic的研究人员将多个Claude智能体交给了一个AI安全领域的经典开放问题弱模型能否可靠地监督强模型呢？这个问题困扰了AI安全领域很多年至今都没有一个完美的答案在实验中

这些Claude智能体自行提出研究假设、自行设计实验方案、自行运行测试并且在并行的智能体之间共享发现不断迭代优化实验的结果非常惊人两位人类研究员花了整整一周的时间只弥补了这个任务性能上下限之间约23%的差距而Claude智能体累计运行了800小时之后弥补了97%的差距也就是说

在这个特定的AI安全研究问题上 AI的表现已经远远超过了人类研究员更值得我们警惕的是 AI提升的不只是执行任务的能力连下一步该做什么的判断能力也在同步增强 Anthropic内部做了一项回溯评测

他们把过去几年里研究人员在项目推进过程中走过的弯路也就是那些最终被证明是错误的研究方向拿给不同版本的Claude模型让它们提出替代方案结果显示最新的Claude Mythos Preview模型给出的研究路径有64%的概率被独立评审认为优于当时人类研究者的实际选择这意味着

AI已经不再仅仅是帮助研究者完成他们已经想好的工作它正在越来越多地参与到研究方向本身的选择当中过去人类研究员负责决定我们要做什么 AI负责帮忙怎么做，而现在 AI已经开始告诉人类我们应该做什么了所有这些数据和实验拼在一起指向的是同一个不可逆转的大趋势

AI正在接管越来越多原本由研究人员亲自完成的工作写代码、调试系统、运行实验、分析结果这些过去占据了研究人员90%以上时间的研发环节正越来越多地由AI来完成而人类的角色则逐渐从研发的执行者变成了研发的监督者和最终决策者

正因为看到了这样的趋势杰克·克拉克对递归自我改进的时间表判断一直都相当激进他在2026年5月估计，到2028年底出现完全自动化AI研发的概率约为60%，而到2027年底这个概率也已经达到了30%。如果克拉克的这个判断是正确的那么我们现在面临的问题很快就会从递归自我改进是否可能出现

变成当它真的出现时我们该怎么办了也正因为如此 Anthropic这篇文章真正想讨论的其实不只是技术本身还有技术发展过快之后我们整个社会所面临的治理问题在文章中 Anthropic提出了AI未来发展的三种可能的图景第一种是AI的能力增长逐渐放缓但是现有的能力已经足够广泛地扩散到各个行业

深刻地改变我们的生产和生活方式第二种是AI继续带来复合型的效率提升人类仍然负责设定整体的研究方向但是越来越多的执行环节被自动化第三种也是最激进、最不可预测的一种

是AI系统真正具备了完整的递归自我改进能力开始完全自主地构建下一代更强大的模型 Anthropic最担心的就是后两种情形因为它们留给社会、政府和安全研究的准备时间都非常有限尤其是第三种情形一旦递归自我改进的闭环真正形成 AI的能力提升速度将会彻底脱离人类的控制

我们可能根本没有时间去制定相应的规则和治理框架也没有时间去适应它所带来的巨大变化在文章的最后 Anthropic将解决问题的答案落到了“减速”与“核查”这两个关键词上它认为如果我们能够有效地放慢前沿AI的开发速度让社会制度和AI对齐研究能够跟上技术的进展

这很可能是一件对全人类都有益的好事但是它同时也强调单方面的暂停是没有任何意义的因为它只会改变谁是行业的领先者并不会让整个行业获得真正的讨论和准备时间真正有用的暂停必须是由多个国家、多家前沿实验室在完全相同的条件下共同减速

并且每一方都能够验证其他参与者确实停了下来说到这里我们就不得不回到视频开头那个问题作为一家势头正猛并且即将上市的公司 Anthropic呼吁停止AI开发的动机真的像它说的那么纯粹吗？首先我们必须承认公开讨论前沿AI的潜在风险确实是Anthropic的一贯作风从成立至今

这家公司确实已经多次发布关于模型能力、安全治理和监管框架的研究与政策文件只不过这一次它讨论的对象从通用人工智能（AGI）变成了递归自我改进（RSI）杰克·克拉克在接受Axios采访的时候也对这个问题做出了解释他说，我们一直发现最好的做法是让大家理解这个概念让人们了解即将发生什么

他表示，这篇文章背后的核心判断是与一些流行观点相反的是 AI的进步在未来几年将会加速保持不变或者放缓的可能性不大他还说 Anthropic希望立法者在真正频繁听到递归自我改进这个词之前就提前了解这个话题

并且开始思考相应的对策但是这个解释显然无法消除所有的质疑风险投资人大卫·萨克斯（David Sacks）同时也是特朗普的重要科技顾问近期就在播客中公开批评了Anthropic 他认为，所谓的全球核查机制听上去是在防范风险但实际效果很可能是抬高整个行业的准入门槛按照他的逻辑

能够满足如此严格的审查、合规和安全要求的往往只有Anthropic、OpenAI、谷歌这样拥有雄厚资金和算力的大公司而开源模型天然分散在全球各地运行根本不可能被统一监管最终的结果可能不是让AI变得更安全而是让少数几家头部公司获得更大的市场优势甚至形成事实上的垄断

类似的质疑之前也出现在了Anthropic的产品层面比如在推出最新模型Mythos的时候 Anthropic对模型的访问权限进行了非常严格的限制理由是这个模型的能力过于强大可能被用于攻击关键基础设施

支持者认为这是一种负责任的安全措施但是批评者则质疑 Anthropic是否在有意强化自己“末日先知”式的形象以此来突出自身的技术领先地位吸引更多的投资和客户除此以外，还有一个更现实也更根本的问题即便我们所有人都相信递归自我改进存在巨大的风险真的有人能停下来吗？我们现在所处的

是一个全球AI竞争异常激烈的环境对于任何一家AI公司来说谁在别人暂停的时候继续跑谁就可能继承领先地位领先地位意味着更多的投资更多的客户，更多的数据以及更快的技术迭代速度在这样的激励机制下没有任何一家公司愿意率先按下暂停键因为那无异于主动放弃自己的竞争优势

而对于国家来说，情况也是一样的 AI已经被公认为是下一代技术革命的核心是未来国家竞争力的关键没有任何一个国家愿意在这场竞争中落后更不用说主动暂停自己的发展 Anthropic在文章最后提出的方案是它将在未来的几个月里

组织全球的政策制定者、研究人员以及其他AI公司参与讨论共同探索构建一套可核查的暂停机制按照它的设想多个国家的多个前沿实验室需要在相同的条件下同时停止开发并且每一方都能够验证其他参与者确实停了下来 “如果”这样的机制真的能够建立起来 Anthropic表示自己预计会减速或暂停

当然，我相信所有人都清楚 “如果”这两个字，看似轻松实则困难无比甚至比实现递归自我改进本身还要困难好了，今天这期视频的核心其实只有一个问题当AI开始建造自己的时候人类到底应该怎么办？

Anthropic的这篇文章无论它的动机是什么至少把这个问题摆在了所有人的面前它提醒我们技术的发展不会自动等待人类的准备我们必须在技术到来之前就开始思考它所带来的影响和挑战对于很多人来说递归自我改进还是一个非常遥远的概念它似乎和我们的日常生活没有太大的关系但是就在一年多以前

Claude还只能写不到10%的生产代码而现在，它已经写了80%。技术的进步往往是指数级的当我们意识到它到来的时候它可能已经改变了一切那么大家觉得 Anthropic的建议靠谱么？ AI的发展速度真的能够停下来么？欢迎在评论区留言感谢收看，我们下期再见

Anthropic呼吁按下AI暂停键？| AI自我改进RSI | 真实动机 | 80%代码Claude编写 | 人均每日合并PR达8倍 | 代码成功率76% | 自主修复bug | 未来的三种可能 · 全文文字稿