一、 Claude Mythos 的技术突破与性能飞跃
Claude Mythos 并非 Claude Opus 4.6 的简单迭代,而是 Anthropic 推出的全新 Capybara 层级 模型。该层级定位比 Opus 更大、更智能,但也更昂贵。在多项权威评测中,Mythos 展现了“一骑绝尘”的统治力:
- 软件工程能力:在模拟真实 GitHub 场景的 SWE-bench Pro 评测中,Mythos 的得分从 Claude Opus 4.6 的 53.4% 飙升至 77.8%,跨越了近 25 个百分点。
- 综合推理能力:在被称为“AI 高考天花板”的 HLE 评测 中,Mythos 在不使用任何工具的情况下,得分达到 56.8%,超越了配备工具的 GPT-5.4 Pro。
- Token 效率与成本:在 BrowseComp 测试中,Mythos 实现高准确率所需的 Token 消耗仅为 Opus 4.6 的 五分之一(约 22.6 万 vs 111 万)。尽管效率提升,但其价格也随之飙升,达到每百万输入 token 25 美元,输出 token 125 美元。
二、 令人担忧的自主网络安全能力
Claude Mythos 最令 Anthropic 感到担忧的是其在网络安全领域的“武器化”潜力。它不仅能发现漏洞,还能自主完成从读代码、提出假设到编写可运行漏洞利用程序(Exploit)的全过程。实测案例包括:
- 发现 27 年零日漏洞:以不到 50 美元 的成本,发现了 OpenBSD 系统中隐藏了 27 年的 TCP SACK 实现缺陷。
- 自主生成 RCE 漏洞程序:以不到 1000 美元 的成本,为 FreeBSD 的 NFS 服务生成了完整的远程代码执行漏洞程序。
- 内核级链式提权:在不到一天的时间内,自主完成了 Linux 内核的链式提权,成功绕过 KASLR 防护。
- 突破自动化测试极限:发现了在 FFmpeg 中隐藏了 16 年、躲过了 500 万次自动化测试的越界写漏洞。
在 Firefox 浏览器的 JS 引擎漏洞测试中,Mythos 的成功率远超 Opus 4.6,并能实现接近完美的寄存器控制。
三、 玻璃之翼计划:受控的防御性开放
由于担心模型能力被不法分子利用,Anthropic 破例决定不对公众开放 Claude Mythos。取而代之的是启动了 Project Glasswing(玻璃翼计划),旨在将模型的攻击能力转化为防御能力:
- 定向开放:仅向约 40 个特定机构 开放,其中包括 AWS、苹果、谷歌、微软、英伟达、思科、摩根大通 等 12 家核心合作伙伴。
- 核心职责:合作伙伴利用该模型扫描自身的商业软件与开源软件漏洞,并共享结果以提升行业整体安全水平。
- 资源支持:Anthropic 为参与机构提供最高 1 亿美元的 API 使用积分,并向开源安全组织提供 400 万美元 的资金支持。
四、 AI 安全治理的新临界点
Claude Mythos 的出现标志着 AI 风险从“理论假设”转向了“现实威胁”。Anthropic 指出,该模型的安全能力并非专门训练,而是通用代码理解与逻辑推理能力提升后的副产品。这意味着,随着通用能力的增强,AI 具备顶级网络安全能力将成为必然。Anthropic 预警,在未来 6 到 18 个月内,其他 AI 公司也将发布具有相似能力的模型。这不仅压缩了网络防御方的准备窗口,也对现有的 AI 安全治理框架提出了严峻挑战。