大家好,这里是最佳拍档,我是大飞 AI最前沿的公司 竟然第一个想要按下AI的暂停键?2026年6月5日的凌晨 Anthropic在官方博客发布了一篇标题为《当AI开始建造自己》的长文 这篇文章发布仅仅十几个小时 全球浏览量就已经超过1000万 几乎所有科技圈、投资圈、政策圈的人都在疯狂转发和讨论

这篇文章由Anthropic的联合创始人杰克·克拉克(Jack Clark) 以及公司内部研究机构的负责人玛丽娜·法瓦罗(Marina Favaro)共同署名 文章的核心观点用一句话就能说清楚 AI正在以超出所有人预期的速度 参与到自身的开发进程当中 如果这个趋势继续发展到极端 未来的某一天

AI将能够在完全没有人类介入的情况下 自主设计、自主测试、自主训练出比自己更强大的下一代AI 基于这个判断 Anthropic向全球所有主要的AI实验室 发出了一个史无前例的呼吁 请考虑暂停前沿AI的开发

或者至少一起建立一套可以互相核查的减速机制 听到这里 可能很多朋友第一反应会觉得很奇怪 因为就在这篇文章发布的前几天 Anthropic刚刚完成了最新一轮的融资 公司估值直接冲到了9650亿美元 正式超过了OpenAI 成为了全球估值最高的私营AI公司 而且就在同一周

Anthropic已经向美国证券交易委员会秘密递交了S-1注册声明草案 正式启动了IPO的筹备流程 更夸张的是它的营收数据 Anthropic的年化营收正在以一种近乎爆炸的速度增长 2025年底的时候还只有大约90亿美元 短短半年时间 现在已经攀升到了接近470亿美元 预计到这个月底

就会突破500亿美元大关 一家在商业上势头如此迅猛 马上就要登陆公开市场 即将迎来自己商业巅峰的公司 对着整个行业喊,大家慢一点 我们先停一停 这怎么看都显得非常违和 甚至有点匪夷所思 也正因为如此,这篇文章发布之后

立刻就引发了关于Anthropic真实动机的巨大争议 有人说这是Anthropic作为行业领先者的责任和担当 也有人说这是它为了巩固自己的垄断地位 故意抬高行业门槛的商业手段 不过在我们深入讨论这些动机之前 还是先来了解一下这篇文章本身 其中的大量内部数据 正在向我们揭示一个越来越清晰

也越来越让人感到不安的趋势 AI研发的自动化 已经不再是科幻小说里的情节 也不是遥远未来的可能性 它正在我们眼前发生 首先我们要明确一个核心概念 那就是这篇文章从头到尾都在围绕的“递归自我改进”(Recursive Self-Improvement 简称RSI) 这个概念其实并不是什么新鲜东西

早在几十年前 人工智能的先驱们就已经提出过这个想法 简单来说 递归自我改进指的就是AI系统能够自主完成设计、测试、训练下一代AI的完整流程 在这个过程中 人类不再扮演任何关键角色 一旦这个闭环形成

AI的能力提升就会进入一个自我加速的循环 它的进步速度会越来越快 快到人类根本无法理解和跟上的程度 在过去很长一段时间里 递归自我改进都被认为是一个非常遥远的理论概念 很多人甚至觉得它可能永远都不会实现 但是就在过去的这一年里 情况发生了根本性的变化 几乎所有的头部AI公司

都开始把大量的资源投入到这个方向 AI研发自动化正在快速成为整个行业的共识 我们先来看OpenAI 作为目前全球最受关注的AI公司 OpenAI早就已经把AI参与AI研发 列入了公司的最高优先级事项 它的安全团队专门设立了递归自我改进准备(Recursive Self-Improvement

Preparedness)相关的岗位 这些岗位的核心任务 就是研究当AI能够显著加速自身研发的时候 可能会带来什么样的能力跃迁 以及我们需要提前做好哪些准备来应对潜在的风险 OpenAI此前也公开透露过他们的内部目标

在2026年前后 打造出能够达到研究实习生水平的AI系统 而到2028年 他们希望实现能够独立承担完整研究任务的自动化AI研究员 再来看谷歌DeepMind 它走的是一条更偏向算法发现的技术路线 DeepMind的AlphaEvolve 就是让AI自主提出算法方案、自主运行实验、自主筛选结果

然后再把筛选出来的优秀方案反馈回系统 进行下一轮的迭代 目前这套系统已经被应用到了很多实际场景中 比如谷歌数据中心的调度优化 以及AI训练效率的提升 根据报道 AlphaEvolve甚至找到了56年来首个对斯特拉森(Strassen)矩阵乘法算法的改进 从某种意义上来说

这也是谷歌DeepMind对“奇点”判断的重要依据之一 当AI开始参与、甚至推动新的科学发现和算法创新的时候 技术进步就会进入一个前所未有的加速循环 除了这些头部巨头之外 越来越多的创业公司也开始围绕自动化AI研发这个方向 进行布局

比如由田渊栋参与创立的Recursive Superintelligence公司 还有把构建擅长AI研发的系统 直接写入公司使命的Mirendil 都是这个趋势的典型代表 虽然这些公司选择的技术路径各不相同 但是它们瞄准的都是同一个终极目标 让AI从一个辅助人类研发的工具 变成研发过程的核心参与者

并且最终承担越来越多 甚至是全部的研发工作 正是在这样一个全行业都在疯狂加速的大背景下 Anthropic发布了这篇长文 它在文章中明确表示 递归自我改进目前还没有发生 也不一定会必然发生 但是它到来的速度 可能比大多数机构准备好的时间要快得多 那么问题来了

AI现在到底已经在多大程度上接管了AI研发呢?

Anthropic在文章中公布了三组此前从未对外公开过的内部数据 第一组数据是关于AI的代码能力 截至2026年5月 Anthropic合并到生产代码库中的代码

有超过80%是由Claude编写的 对比一下 在2025年2月Claude Code正式上线之前 这个比例还只是个位数 也就是说 仅仅用了一年零三个月的时间 Claude就从一个几乎不会写生产代码的AI 变成了Anthropic代码库的主要贡献者 与之对应的是工程师生产力的巨大提升

2026年第二季度 Anthropic工程师人均每天合并的代码量 达到了2024年的8倍 当然,文章也专门补充说明 代码行数衡量的只是代码的数量 而不是代码的质量,所以8倍这个数字 很可能高估了真实的生产力提升 但是无论如何 这个趋势是非常清晰的 工程师的角色正在发生根本性的转变

从过去那个亲自写代码的执行者 逐渐变成了给AI指引方向

而且更重要的是 Claude写的代码质量还在以非常快的速度提升 Anthropic内部一直在跟踪一个指标 那就是工程师在使用Claude Code工作的过程中 需要纠正AI的错误 或者中途接管任务的频率 这个频率在过去的一年里一直在持续下降 到2026年5月

Claude处理最高难度开放式任务的成功率 已经达到了76%,而在六个月之前 这个数字还只有26%, 短短半年时间就上升了50个百分点 第二组数据涉及了AI的科研能力 Anthropic有一个内部的基准测试 测试的方法很简单 给Claude一段训练小型AI模型的CPU代码

要求它在不改变代码正确性的前提下 尽可能地提升运行速度 2025年5月的时候 当时最先进的Claude Opus 4模型 在这个测试中的平均加速比大约是3倍 而到了2026年4月 最新的Claude Mythos Preview模型 这个数字已经达到了大约52倍

对比一下,一名熟练的人类AI研究员 通常需要花费四到八个小时的时间 才能让这段代码达到大约4倍的加速 虽然Anthropic特别提醒 这个绝对加速倍数会受到起始代码本身优化空间的影响 不应该把它直接解读为真实世界中AI训练速度的提升倍数 但是仅仅一年的时间 这个倍数的提升也足够值得我们重视了

第三组数据来自于日常的工程实践 2026年4月 Claude自主修复了超过800个API错误 并且将该类错误的发生率降低了约1000倍 负责这个项目的工程师估计 如果同样的工作交给人类来做 大概需要四年的时间才能完成 为什么会有这么大的差距呢?

因为修复别人写的Bug 本来就是一个非常漫长而痛苦的过程 人类很难同时记住那么多不熟悉的代码上下文 也很难在短时间内排查出所有可能的问题 但这类任务恰恰是AI的优势所在 它可以在极短的时间内阅读和理解整个代码库 并且系统性地找出所有潜在的错误

除了这三组核心数据之外 文章还公布了一个非常有意思的实验 2026年4月 Anthropic的研究人员将多个Claude智能体 交给了一个AI安全领域的经典开放问题 弱模型能否可靠地监督强模型呢?这个问题困扰了AI安全领域很多年 至今都没有一个完美的答案 在实验中

这些Claude智能体自行提出研究假设、自行设计实验方案、自行运行测试 并且在并行的智能体之间共享发现 不断迭代优化 实验的结果非常惊人 两位人类研究员花了整整一周的时间 只弥补了这个任务性能上下限之间约23%的差距 而Claude智能体累计运行了800小时之后 弥补了97%的差距 也就是说

在这个特定的AI安全研究问题上 AI的表现已经远远超过了人类研究员 更值得我们警惕的是 AI提升的不只是执行任务的能力 连下一步该做什么的判断能力也在同步增强 Anthropic内部做了一项回溯评测

他们把过去几年里研究人员在项目推进过程中走过的弯路 也就是那些最终被证明是错误的研究方向 拿给不同版本的Claude模型 让它们提出替代方案 结果显示 最新的Claude Mythos Preview模型给出的研究路径 有64%的概率被独立评审认为 优于当时人类研究者的实际选择 这意味着

AI已经不再仅仅是帮助研究者 完成他们已经想好的工作 它正在越来越多地参与到研究方向本身的选择当中 过去 人类研究员负责决定我们要做什么 AI负责帮忙怎么做,而现在 AI已经开始告诉人类 我们应该做什么了 所有这些数据和实验拼在一起 指向的是同一个不可逆转的大趋势

AI正在接管越来越多原本由研究人员亲自完成的工作 写代码、调试系统、运行实验、分析结果 这些过去占据了研究人员90%以上时间的研发环节 正越来越多地由AI来完成 而人类的角色 则逐渐从研发的执行者 变成了研发的监督者和最终决策者

正因为看到了这样的趋势 杰克·克拉克对递归自我改进的时间表判断 一直都相当激进 他在2026年5月估计,到2028年底 出现完全自动化AI研发的概率约为60%, 而到2027年底 这个概率也已经达到了30%。如果克拉克的这个判断是正确的 那么我们现在面临的问题 很快就会从递归自我改进是否可能出现

变成当它真的出现时 我们该怎么办了 也正因为如此 Anthropic这篇文章真正想讨论的 其实不只是技术本身 还有技术发展过快之后 我们整个社会所面临的治理问题 在文章中 Anthropic提出了AI未来发展的三种可能的图景 第一种是AI的能力增长逐渐放缓 但是现有的能力已经足够广泛地扩散到各个行业

深刻地改变我们的生产和生活方式 第二种是AI继续带来复合型的效率提升 人类仍然负责设定整体的研究方向 但是越来越多的执行环节被自动化 第三种 也是最激进、最不可预测的一种

是AI系统真正具备了完整的递归自我改进能力 开始完全自主地构建下一代更强大的模型 Anthropic最担心的就是后两种情形 因为它们留给社会、政府和安全研究的准备时间 都非常有限 尤其是第三种情形 一旦递归自我改进的闭环真正形成 AI的能力提升速度将会彻底脱离人类的控制

我们可能根本没有时间去制定相应的规则和治理框架 也没有时间去适应它所带来的巨大变化 在文章的最后 Anthropic将解决问题的答案 落到了“减速”与“核查”这两个关键词上 它认为 如果我们能够有效地放慢前沿AI的开发速度 让社会制度和AI对齐研究能够跟上技术的进展

这很可能是一件对全人类都有益的好事 但是它同时也强调 单方面的暂停是没有任何意义的 因为它只会改变谁是行业的领先者 并不会让整个行业获得真正的讨论和准备时间 真正有用的暂停 必须是由多个国家、多家前沿实验室 在完全相同的条件下共同减速

并且每一方都能够验证其他参与者确实停了下来 说到这里 我们就不得不回到视频开头那个问题 作为一家势头正猛 并且即将上市的公司 Anthropic呼吁停止AI开发的动机 真的像它说的那么纯粹吗?首先我们必须承认 公开讨论前沿AI的潜在风险 确实是Anthropic的一贯作风 从成立至今

这家公司确实已经多次发布关于模型能力、安全治理和监管框架的研究与政策文件 只不过这一次 它讨论的对象从通用人工智能(AGI) 变成了递归自我改进(RSI) 杰克·克拉克在接受Axios采访的时候 也对这个问题做出了解释 他说,我们一直发现 最好的做法是让大家理解这个概念 让人们了解即将发生什么

他表示,这篇文章背后的核心判断是 与一些流行观点相反的是 AI的进步在未来几年将会加速 保持不变或者放缓的可能性不大 他还说 Anthropic希望立法者在真正频繁听到递归自我改进这个词之前 就提前了解这个话题

并且开始思考相应的对策 但是这个解释 显然无法消除所有的质疑 风险投资人大卫·萨克斯(David Sacks) 同时也是特朗普的重要科技顾问 近期就在播客中公开批评了Anthropic 他认为,所谓的全球核查机制 听上去是在防范风险 但实际效果很可能是抬高整个行业的准入门槛 按照他的逻辑

能够满足如此严格的审查、合规和安全要求的 往往只有Anthropic、OpenAI、谷歌这样拥有雄厚资金和算力的大公司 而开源模型天然分散在全球各地运行 根本不可能被统一监管 最终的结果 可能不是让AI变得更安全 而是让少数几家头部公司获得更大的市场优势 甚至形成事实上的垄断

类似的质疑之前也出现在了Anthropic的产品层面 比如在推出最新模型Mythos的时候 Anthropic对模型的访问权限进行了非常严格的限制 理由是这个模型的能力过于强大 可能被用于攻击关键基础设施

支持者认为这是一种负责任的安全措施 但是批评者则质疑 Anthropic是否在有意强化自己“末日先知”式的形象 以此来突出自身的技术领先地位 吸引更多的投资和客户 除此以外,还有一个更现实 也更根本的问题 即便我们所有人都相信递归自我改进存在巨大的风险 真的有人能停下来吗?我们现在所处的

是一个全球AI竞争异常激烈的环境 对于任何一家AI公司来说 谁在别人暂停的时候继续跑 谁就可能继承领先地位 领先地位意味着更多的投资 更多的客户,更多的数据 以及更快的技术迭代速度 在这样的激励机制下 没有任何一家公司愿意率先按下暂停键 因为那无异于主动放弃自己的竞争优势

而对于国家来说,情况也是一样的 AI已经被公认为是下一代技术革命的核心 是未来国家竞争力的关键 没有任何一个国家愿意在这场竞争中落后 更不用说主动暂停自己的发展 Anthropic在文章最后提出的方案是 它将在未来的几个月里

组织全球的政策制定者、研究人员以及其他AI公司参与讨论 共同探索构建一套可核查的暂停机制 按照它的设想 多个国家的多个前沿实验室 需要在相同的条件下同时停止开发 并且每一方都能够验证其他参与者确实停了下来 “如果”这样的机制真的能够建立起来 Anthropic表示自己预计会减速或暂停

当然,我相信所有人都清楚 “如果”这两个字,看似轻松 实则困难无比 甚至比实现递归自我改进本身还要困难 好了,今天这期视频的核心 其实只有一个问题 当AI开始建造自己的时候 人类到底应该怎么办?

Anthropic的这篇文章 无论它的动机是什么 至少把这个问题摆在了所有人的面前 它提醒我们 技术的发展不会自动等待人类的准备 我们必须在技术到来之前 就开始思考它所带来的影响和挑战 对于很多人来说 递归自我改进还是一个非常遥远的概念 它似乎和我们的日常生活没有太大的关系 但是就在一年多以前

Claude还只能写不到10%的生产代码 而现在,它已经写了80%。 技术的进步往往是指数级的 当我们意识到它到来的时候 它可能已经改变了一切 那么大家觉得 Anthropic的建议靠谱么? AI的发展速度真的能够停下来么? 欢迎在评论区留言 感谢收看,我们下期再见