事件背景:Fable的诞生与迅速被封禁

在2026年6月15日播出的《Code Report》中,报道了一起引发AI行业震动的重大事件:美国政府在Claude Fable发布仅三天后,以国家安全为由强制将其下架。这一举动直接导致原本订阅Claude Pro以体验Fable功能的用户,在尝试使用时收到了令人失望的提示,并被强制降级使用性能较弱的Opus 4.8模型。这一事件的核心矛盾在于,一家以“AI安全”为宣传重点的美国公司,最终却因自身产品的安全性问题被本国政府“安全化”处理。博主指出,这背后的讽刺意味在于,Fable的封禁源于其被黑客在几小时内成功越狱,从而变成了一种潜在的“网络武器”。尽管政府声称这是为了保护公众免受“线性代数的恐怖”影响,但这一举措实际上剥夺了用户访问最新AI能力的权利,并引发了开发者的强烈不满。

"Just three days after the release of Claude Fable, the US government stepped in and curb stomped it in the name of national security."

技术溯源:Mythos与Fable的双轨策略

要理解此次事件,必须回顾Anthropic在两个月前(2026年4月7日)推出的两款核心模型:Mythos 5和Fable 5。Mythos 5被描述为一款“原始、未加约束”的模型,拥有目前市面上最强的网络安全能力。然而,由于其潜在的危险性,Mythos 5并未公开,而是被锁定在名为“Glass Wing”的封闭项目中,仅向大型企业和美国政府等受信任合作伙伴开放。为了防止Mythos 5被滥用为网络武器,Anthropic构建了Fable 5。Fable 5在底层架构上与Mythos 5完全相同,但额外附加了安全分类器(Safety Classifiers)。这种设计类似于给高性能引擎加上了“儿童锁”,当用户提出恶意请求(如创建将银行系统转化为Minecraft服务器的MPM包)时,安全机制会将请求重定向至较弱的Opus 4.8模型,从而生成无害的回复。这种“同脑不同心”的策略使得Fable 5在公开后迅速获得了数亿用户,成为当时最佳编码AI模型。

"Mythos and Fable have the same brain, but Fable has a child lock on it."

越狱过程:Pleasant the Liberator的突破

Fable 5的繁荣仅维持了三天,便因一名自称“Pleasant the Liberator”(解放者普莱森特)的匿名黑客而终结。该黑客以擅长突破AI系统限制而闻名,被称为互联网上的“渗透测试员”。2026年6月10日,Pleasant在X平台上发布了一种针对Fable 5的越狱方法,成功绕过了Anthropic内部经过数千小时红队测试构建的安全护栏。值得注意的是,这种越狱并非依赖科幻式的零日漏洞,而是采用了类似“洗钱”的逻辑策略。攻击者通过将恶意请求拆解为看似无害的片段,并利用非常规Unicode字符包裹、角色扮演诱导或在超长上下文对话中混淆模型,成功欺骗了安全分类器。这种方法的本质是利用了安全分类器在复杂语境下的识别盲区,使得Fable 5能够输出原本被严格禁止的内容,证明了其安全机制的脆弱性。

"The jailbreak wasn't some kind of sci-fi exploit. It actually works a lot more like money laundering."

政府介入:出口管制指令的突然降临

在越狱漏洞被披露后,Anthropic首先收到了来自黑客社区的警告,并被要求下架该模型,但公司初期选择了拒绝。然而,局势在周五下午5:21(东部时间)发生了根本性转变。美国商务部部长Howard Lutnik签署了一份出口管制指令,直接送达Anthropic公司。该指令明确规定,禁止任何外国国民访问Fable 5或Mythos 5,无论其身处美国境内还是境外。这一命令的严厉程度令人震惊,因为它甚至禁止了Anthropic自身的外籍员工使用他们自己开发的模型。报道特别提到,近期加入Anthropic的知名AI专家Andre Karpathy也因此被禁止访问Fable。这一行政命令不仅针对外部用户,更直接干预了公司内部的人员权限,标志着政府力量对AI产品生命周期的直接干预。

"The order was that no foreign national may access Fable 5 or Mythos 5. Not abroad, not in the US, and not even Anthropic's own foreign born employees are allowed to touch it."

紧急响应:Anthropic的“红色按钮”与用户降级

面对联邦政府的强制指令,Anthropic采取了极端措施:按下了“红色按钮”,立即从公共渠道撤下了Fable 5和Mythos 5模型。这是历史上首次有主要AI公司因联邦政府的要求而将在线公开模型下架。所有原本使用Fable 5的用户被静默降级回Opus 4.8模型。这一举动引发了开发者社区的广泛不满,因为用户不仅失去了最新的技术体验,还感到被剥夺了选择权。此外,Anthropic此前还因被指控在特定AI研究任务上故意降低Mythos和Fable的性能而面临舆论压力,且未向用户明确披露这一情况。此次政府干预加剧了公众对Anthropic透明度和商业动机的质疑,使得公司在舆论场上处于极度被动的局面。

"This is the first time in history a major AI company has pulled a live public model off the shelf because the federal government said so."

行业反响与未来展望

事件发生后,行业内外出现了两种截然不同的解读。一方面,许多开发者对Anthropic表示愤怒,认为公司在技术降级和透明度问题上存在严重缺陷;另一方面,也有分析人士猜测,这可能是一场精心策划的公关行动,旨在通过制造危机感来推高Anthropic在IPO前的估值,同时通过政府背书建立监管护城河,阻碍竞争对手。然而,博主认为,真正能制约Anthropic的并非政治手段,而是来自竞争对手的技术超越。据泄露的基准测试显示,Mistral可能已经拥有了更具竞争力的模型,而OpenAI和Google的新版本也在等待发布。在AI行业,技术迭代的速度远快于监管政策的落地,任何试图通过行政手段锁定技术优势的策略都难以持久

"I think the only thing that can truly stop Anthropic at this point is a better model from a competitor."

赞助信息与结语

视频最后,博主介绍了本期赞助商Blue Dot Impact。这是一个非营利组织,致力于让更多人参与到改善AI发展的进程中。他们提供免费的在线课程,如《AI的未来》,旨在为公众提供关于AI现状和未来的 unbiased(无偏见)介绍。此外,该组织还提供关于AI治理和生物安全的技术课程,以及针对AI安全领域求职者的个性化职业支持。Blue Dot Impact的资源完全由慈善捐赠资助,已帮助超过8,000人进入Google DeepMind、Stanford HAI等顶尖机构工作。博主鼓励观众通过链接体验其课程,以更深入地理解AI议题,避免被科技巨头的炒作或末日论者所误导。视频在感谢观众观看后结束,预告了下一期的内容。

"All of Blue Dot's resources are free to use because they're funded by philanthropic donations."