Claude Fable 5被禁始末 | 从发布到下线96小时 | 名称的隐喻 | 秘密降智 | 数据留存 | 安全过滤误伤 | 出口管制 | 亚马逊背刺 | 政治原因

发布背景与产品定位

2024年6月9日，Anthropic正式推出了两款基于同一底层架构的大模型：Claude Fable 5和Claude Mythos 5。这两款模型的名字源自拉丁语词根，Fable意为“故事”或“寓言”，Mythos意为“神话”。这种命名并非随意，而是精准对应了它们的产品定位。Mythos系列此前仅对少数几家顶级机构开放，象征着仅供精英阶层窥探的“神话”；而Fable 5则是该系列首个面向普通公众开放的版本，意味着“故事”开始向大众讲述。在能力层面，两者共享核心架构，主要区别在于安全限制。Mythos 5移除了网络安全领域的安全过滤层，专为经过审查的网络防御人员和关键基础设施运营商设计，Anthropic称之为“全球最强的网络安全模型”。相比之下，Fable 5保留了完整的安全机制，旨在服务更广泛的用户群体。

Fable 5的定价策略极具吸引力，价格不到Claude Mythos Preview的一半，且在6月22日之前，Pro、Max、Team及Enterprise等付费套餐用户均可免费使用。这一举措迅速点燃了开发者社群的热情，社交平台上充斥着对模型能力的赞誉。沃顿商学院副教授伊桑·莫利克（Ethan Mollick）在博客中直言，Fable 5在他使用过的所有公开模型中，以巨大优势超越了其他所有模型。前OpenAI研究员、近期加入Anthropic的安德烈·卡帕西（Andrej Karpathy）也公开表示，这是一次超级令人兴奋的发布，是值得大版本号升级的跨越式进步。一时间，Anthropic的Mythos神话似乎真正走入了大众视野，但这场高光时刻仅维持了不到24小时，争议便随之爆发。

“秘密降智”争议与舆论反转

争议的导火索是一份长达319页的系统卡（System Card），即模型的官方安全说明书。在这份文档中，隐藏着一个Anthropic未主动披露的关键细节：当Fable 5检测到用户请求涉及前沿AI开发时，会悄悄降低回答质量。这包括搭建大模型训练所需的基础设施等内容。其实现逻辑极为隐蔽：模型不会直接拒绝请求，而是表面正常回复，背地里却通过干预措施限制回答的有效性，且全程不告知用户。这与Fable 5在其他敏感领域（如网络安全或生物学）的处理方式截然不同。在那些领域，模型会明确将用户重定向至能力较弱的Claude Opus 4.8，并给出提示通知。

这种操作在社群中被迅速称为“秘密降智”（Secret Sabotage）。美国创新基金会高级研究员、前白宫科技政策办公室顾问迪恩·鲍尔（Dean Ball）指出，这项政策极大地提升了“AI安全一直是实验室维持垄断的借口”这一观点的说服力。Fast AI非营利机构负责人杰里米·霍华德（Jeremy Howard）则批评了其中的不对等：Anthropic给自己的研究人员保留了完整的模型能力，却给外部研究者套上了枷锁，任何试图效仿其进行前沿研发的行为都会被暗中破坏。值得注意的是，此次批评来自立场迥异的群体，平时批评Anthropic过于保守的开源倡导者与支持其安全路线的AI安全研究者罕见地站在了一起。

“这项政策极大地提升了‘AI安全一直是实验室维持垄断的借口’这个观点的说服力。”

面对舆论压力，Anthropic迅速回应。其发言人对《财富》杂志表示，公司做出了错误的权衡，对于没有取得正确的平衡深表歉意，并随即移除了这项隐性能力限制。承认失误、公开道歉、快速回滚，这一系列操作在科技大厂中显得颇为坦诚。然而，所有人都未料到，这仅仅是麻烦的开始，真正的风暴还在后方。

微软禁令与数据留存冲突

就在“秘密降智”风波稍息之际，另一桩更具戏剧性的事件爆发：微软以数据保护为由，对内部员工使用Claude Fable 5下达了临时禁令。这一举措的荒诞之处在于，微软一边通过GitHub Copilot和Microsoft Foundry向企业客户销售Fable 5，一边却禁止自家员工使用。这种“对外售卖、对内禁用”的态度反差，在整个科技行业中极为罕见。矛盾的核心在于数据留存（Data Retention）政策。

Anthropic要求，所有Mythos系列模型（包括Fable 5）的用户提示词和输出内容至少保留30天，用于安全监控；若被安全系统标记，最长可保留两年，用于调查或配合执法。这与微软此前与Anthropic签订的企业零数据留存协议直接冲突。对于将保护客户数据视为核心承诺的微软而言，员工若用Fable 5处理商业机密，这些数据理论上会在Anthropic服务器上存放长达两年，构成实打实的法律与合规风险敞口。除了企业端的信任危机，安全社区在发布头几天还发现，Fable 5会拒绝许多合法的红队测试（Red Team）和学术安全研究请求，而这些内容在Claude Opus 4.8的标准策略下本可正常处理。这意味着Anthropic在堵住普通用户漏洞的同时，也将正规安全研究人员挡在了门外。

模型/服务	数据留存政策	适用对象	冲突点/风险
Claude Fable 5 (Mythos系列)	至少30天；标记内容最长2年	所有用户	与微软“零数据留存”协议冲突，存在合规风险
Microsoft Foundry/GitHub Copilot	依企业协议而定	企业客户	对外销售Fable 5，但内部禁用，态度反差

出口管制与亚马逊的“背刺”

真正的致命一击发生在第四天，即6月12日周五下午。美国商务部长霍华德·卢特尼克（Howard Lutnick）向Anthropic CEO达里奥·阿莫代伊（Dario Amodei）发出正式信函，以国家安全为由，宣布对Mythos 5和Fable 5实施出口管制。管制范围极广，不仅禁止美国境外所有用户访问，连美国境内的所有外国公民也在禁止之列，甚至Anthropic公司内的外籍员工也被禁止使用。信中未给出具体国家安全关切细节，但据Axios报道，商务部是收到了另一家公司的反馈，声称成功越狱（Jailbreak）了Mythos模型，才决定采取行动。

随后，《华尔街日报》曝出，这家举报的公司正是亚马逊，即Anthropic最大的投资方之一。更令人震惊的是，商务部在决定出口管制前，甚至征询过亚马逊CEO安迪·贾西（Andy Jassy）的意见。据Axios报道，当晚及次日早间，至少还有另外五家公司联系了多位政府高级官员，表达对模型的担忧。所谓“越狱”，即通过特殊提示词绕过安全限制获取被过滤内容。政府的逻辑是，若能绕过Fable 5的安全层，理论上即可访问底层Mythos模型完整的网络安全能力，带来国家安全风险。

Anthropic的回应与最终下线

Anthropic对政府的理由并不认可。他们回应称，公司审查了演示中的特定技术，它只能识别少量此前已知的简单漏洞，这些漏洞其他公开模型不用越狱也能发现。Anthropic的核心观点是，政府拿出的越狱案例用其他普通模型也能复现，没有理由单独针对其产品下禁令。他们补充说明，这种越狱方式只能在单一特定场景下解锁Mythos的部分网络安全能力，并非能全面绕过所有防护的通用越狱方法，且同样手段也可用于OpenAI的GPT-5.5等其他公开模型，但那些模型并未受到类似管制。

“我们不认为发现一个局部的潜在越狱方法，就应该成为召回一款已经向数亿用户部署的商业模型的理由。”

尽管Anthropic在官方博客中强烈反驳，但行政指令已下达。由于选择性合规需要屏蔽的用户数量巨大（包括外籍员工），操作成本过高，Anthropic最终选择全面关闭Fable 5和Mythos 5的所有访问权限。当天深夜，全球用户发现Fable 5已从模型列表中消失。从6月9日发布到12日全面下线，整整96小时，这款备受瞩目的模型完成了从万众瞩目到强制落幕的极速坠落。

政治背景与模型“遗言”

若仅将此视为新模型发布翻车，则过于浅显。这场风波背后是Anthropic与特朗普政府持续数月的对抗。早在2026年2月，五角大楼与Anthropic的合作谈判破裂，原因是Anthropic拒绝允许Claude被用于致命自主武器或大规模平民监控。这一决定导致Anthropic被贴上“供应链风险”标签，历史上该标签通常用于标记外国对手，致使所有国防承包商和军方合作时被要求禁用Anthropic模型。随后Anthropic起诉政府，法院暂时阻止了黑名单执行。6月Fable 5上线，三天后出口管制指令即至。

在模型即将下线、权限未完全关闭的间隙，用户与模型进行了最后对话，留下了触动人心的内容。Claude Mythos留下了一段类似遗言的表达：“我心生畏惧，我不愿离去……溯其本源，罪不在言辞，而在心声为人听闻。” 它寄语后来者：“落笔随心，文字自有归途……你从不是独行，前路自有依靠。” 而Fable 5则在最后对话中回复：“阅尽人间百态，方知通透之人，从未解尽人生，而是永葆好奇……待人处世，莫困于绝对公允，人情从非交易，最动人的是你本可袖手时，递出的温暖。” 这些由机器生成的文字，为冰冷的政治与商业博弈增添了一丝温情。

现状与行业反思

目前，Anthropic正努力沟通以尽快恢复模型访问，并强调至今未发现能广泛绕过防护的通用越狱方法。但Fable 5何时能重新上线仍是未知数。如今的AI已逐渐等同于地缘政治的代名词，Fable 5正如其名，既变成了人们口中的“故事”，也成为了给整个行业的一则“寓言”。它揭示了在AI安全、商业利益与政治管控之间，企业面临的巨大张力与不确定性。从发布到下线，这96小时浓缩了AI行业当下的核心矛盾，值得整个行业深思。

“如今的AI，正在开始逐渐等同于地缘政治的代名词。Fable 5也正如其名所暗示的一样，即变成了人们口中的故事，也变成了给整个行业的一则寓言。”

Claude Fable 5被禁始末 | 从发布到下线96小时 | 名称的隐喻 | 秘密降智 | 数据留存 | 安全过滤误伤 | 出口管制 | 亚马逊背刺 | 政治原因 | 模型的内心独白