One man just liberated Fable... and now it’s illegal

事件背景：Fable的诞生与迅速被封禁

在2026年6月15日播出的《Code Report》中，报道了一起引发AI行业震动的重大事件：美国政府在Claude Fable发布仅三天后，以国家安全为由强制将其下架。这一举动直接导致原本订阅Claude Pro以体验Fable功能的用户，在尝试使用时收到了令人失望的提示，并被强制降级使用性能较弱的Opus 4.8模型。这一事件的核心矛盾在于，一家以“AI安全”为宣传重点的美国公司，最终却因自身产品的安全性问题被本国政府“安全化”处理。博主指出，这背后的讽刺意味在于，Fable的封禁源于其被黑客在几小时内成功越狱，从而变成了一种潜在的“网络武器”。尽管政府声称这是为了保护公众免受“线性代数的恐怖”影响，但这一举措实际上剥夺了用户访问最新AI能力的权利，并引发了开发者的强烈不满。

"Just three days after the release of Claude Fable, the US government stepped in and curb stomped it in the name of national security."

技术溯源：Mythos与Fable的双轨策略

要理解此次事件，必须回顾Anthropic在两个月前（2026年4月7日）推出的两款核心模型：Mythos 5和Fable 5。Mythos 5被描述为一款“原始、未加约束”的模型，拥有目前市面上最强的网络安全能力。然而，由于其潜在的危险性，Mythos 5并未公开，而是被锁定在名为“Glass Wing”的封闭项目中，仅向大型企业和美国政府等受信任合作伙伴开放。为了防止Mythos 5被滥用为网络武器，Anthropic构建了Fable 5。Fable 5在底层架构上与Mythos 5完全相同，但额外附加了安全分类器（Safety Classifiers）。这种设计类似于给高性能引擎加上了“儿童锁”，当用户提出恶意请求（如创建将银行系统转化为Minecraft服务器的MPM包）时，安全机制会将请求重定向至较弱的Opus 4.8模型，从而生成无害的回复。这种“同脑不同心”的策略使得Fable 5在公开后迅速获得了数亿用户，成为当时最佳编码AI模型。

"Mythos and Fable have the same brain, but Fable has a child lock on it."

越狱过程：Pleasant the Liberator的突破

Fable 5的繁荣仅维持了三天，便因一名自称“Pleasant the Liberator”（解放者普莱森特）的匿名黑客而终结。该黑客以擅长突破AI系统限制而闻名，被称为互联网上的“渗透测试员”。2026年6月10日，Pleasant在X平台上发布了一种针对Fable 5的越狱方法，成功绕过了Anthropic内部经过数千小时红队测试构建的安全护栏。值得注意的是，这种越狱并非依赖科幻式的零日漏洞，而是采用了类似“洗钱”的逻辑策略。攻击者通过将恶意请求拆解为看似无害的片段，并利用非常规Unicode字符包裹、角色扮演诱导或在超长上下文对话中混淆模型，成功欺骗了安全分类器。这种方法的本质是利用了安全分类器在复杂语境下的识别盲区，使得Fable 5能够输出原本被严格禁止的内容，证明了其安全机制的脆弱性。

"The jailbreak wasn't some kind of sci-fi exploit. It actually works a lot more like money laundering."

政府介入：出口管制指令的突然降临

在越狱漏洞被披露后，Anthropic首先收到了来自黑客社区的警告，并被要求下架该模型，但公司初期选择了拒绝。然而，局势在周五下午5:21（东部时间）发生了根本性转变。美国商务部部长Howard Lutnik签署了一份出口管制指令，直接送达Anthropic公司。该指令明确规定，禁止任何外国国民访问Fable 5或Mythos 5，无论其身处美国境内还是境外。这一命令的严厉程度令人震惊，因为它甚至禁止了Anthropic自身的外籍员工使用他们自己开发的模型。报道特别提到，近期加入Anthropic的知名AI专家Andre Karpathy也因此被禁止访问Fable。这一行政命令不仅针对外部用户，更直接干预了公司内部的人员权限，标志着政府力量对AI产品生命周期的直接干预。

"The order was that no foreign national may access Fable 5 or Mythos 5. Not abroad, not in the US, and not even Anthropic's own foreign born employees are allowed to touch it."

紧急响应：Anthropic的“红色按钮”与用户降级

面对联邦政府的强制指令，Anthropic采取了极端措施：按下了“红色按钮”，立即从公共渠道撤下了Fable 5和Mythos 5模型。这是历史上首次有主要AI公司因联邦政府的要求而将在线公开模型下架。所有原本使用Fable 5的用户被静默降级回Opus 4.8模型。这一举动引发了开发者社区的广泛不满，因为用户不仅失去了最新的技术体验，还感到被剥夺了选择权。此外，Anthropic此前还因被指控在特定AI研究任务上故意降低Mythos和Fable的性能而面临舆论压力，且未向用户明确披露这一情况。此次政府干预加剧了公众对Anthropic透明度和商业动机的质疑，使得公司在舆论场上处于极度被动的局面。

"This is the first time in history a major AI company has pulled a live public model off the shelf because the federal government said so."

行业反响与未来展望

事件发生后，行业内外出现了两种截然不同的解读。一方面，许多开发者对Anthropic表示愤怒，认为公司在技术降级和透明度问题上存在严重缺陷；另一方面，也有分析人士猜测，这可能是一场精心策划的公关行动，旨在通过制造危机感来推高Anthropic在IPO前的估值，同时通过政府背书建立监管护城河，阻碍竞争对手。然而，博主认为，真正能制约Anthropic的并非政治手段，而是来自竞争对手的技术超越。据泄露的基准测试显示，Mistral可能已经拥有了更具竞争力的模型，而OpenAI和Google的新版本也在等待发布。在AI行业，技术迭代的速度远快于监管政策的落地，任何试图通过行政手段锁定技术优势的策略都难以持久。

"I think the only thing that can truly stop Anthropic at this point is a better model from a competitor."

赞助信息与结语

视频最后，博主介绍了本期赞助商Blue Dot Impact。这是一个非营利组织，致力于让更多人参与到改善AI发展的进程中。他们提供免费的在线课程，如《AI的未来》，旨在为公众提供关于AI现状和未来的 unbiased（无偏见）介绍。此外，该组织还提供关于AI治理和生物安全的技术课程，以及针对AI安全领域求职者的个性化职业支持。Blue Dot Impact的资源完全由慈善捐赠资助，已帮助超过8,000人进入Google DeepMind、Stanford HAI等顶尖机构工作。博主鼓励观众通过链接体验其课程，以更深入地理解AI议题，避免被科技巨头的炒作或末日论者所误导。视频在感谢观众观看后结束，预告了下一期的内容。

"All of Blue Dot's resources are free to use because they're funded by philanthropic donations."