最强模型Claude Mythos公开 | Anthropic | 暂不对公众开放 | 玻璃之翼计划 | 编程能力跃升 | HLE轻松第一 | token消耗20%

一、 Claude Mythos 的技术突破与性能飞跃

Claude Mythos 并非 Claude Opus 4.6 的简单迭代，而是 Anthropic 推出的全新 Capybara 层级 模型。该层级定位比 Opus 更大、更智能，但也更昂贵。在多项权威评测中，Mythos 展现了“一骑绝尘”的统治力：

软件工程能力：在模拟真实 GitHub 场景的 SWE-bench Pro 评测中，Mythos 的得分从 Claude Opus 4.6 的 53.4% 飙升至 77.8%，跨越了近 25 个百分点。
综合推理能力：在被称为“AI 高考天花板”的 HLE 评测 中，Mythos 在不使用任何工具的情况下，得分达到 56.8%，超越了配备工具的 GPT-5.4 Pro。
Token 效率与成本：在 BrowseComp 测试中，Mythos 实现高准确率所需的 Token 消耗仅为 Opus 4.6 的 五分之一（约 22.6 万 vs 111 万）。尽管效率提升，但其价格也随之飙升，达到每百万输入 token 25 美元，输出 token 125 美元。

二、令人担忧的自主网络安全能力

Claude Mythos 最令 Anthropic 感到担忧的是其在网络安全领域的“武器化”潜力。它不仅能发现漏洞，还能自主完成从读代码、提出假设到编写可运行漏洞利用程序（Exploit）的全过程。实测案例包括：

发现 27 年零日漏洞：以不到 50 美元 的成本，发现了 OpenBSD 系统中隐藏了 27 年的 TCP SACK 实现缺陷。
自主生成 RCE 漏洞程序：以不到 1000 美元 的成本，为 FreeBSD 的 NFS 服务生成了完整的远程代码执行漏洞程序。
内核级链式提权：在不到一天的时间内，自主完成了 Linux 内核的链式提权，成功绕过 KASLR 防护。
突破自动化测试极限：发现了在 FFmpeg 中隐藏了 16 年、躲过了 500 万次自动化测试的越界写漏洞。

在 Firefox 浏览器的 JS 引擎漏洞测试中，Mythos 的成功率远超 Opus 4.6，并能实现接近完美的寄存器控制。

三、玻璃之翼计划：受控的防御性开放

由于担心模型能力被不法分子利用，Anthropic 破例决定不对公众开放 Claude Mythos。取而代之的是启动了 Project Glasswing（玻璃翼计划），旨在将模型的攻击能力转化为防御能力：

定向开放：仅向约 40 个特定机构 开放，其中包括 AWS、苹果、谷歌、微软、英伟达、思科、摩根大通 等 12 家核心合作伙伴。
核心职责：合作伙伴利用该模型扫描自身的商业软件与开源软件漏洞，并共享结果以提升行业整体安全水平。
资源支持：Anthropic 为参与机构提供最高 1 亿美元的 API 使用积分，并向开源安全组织提供 400 万美元 的资金支持。

四、 AI 安全治理的新临界点

Claude Mythos 的出现标志着 AI 风险从“理论假设”转向了“现实威胁”。Anthropic 指出，该模型的安全能力并非专门训练，而是通用代码理解与逻辑推理能力提升后的副产品。这意味着，随着通用能力的增强，AI 具备顶级网络安全能力将成为必然。Anthropic 预警，在未来 6 到 18 个月内，其他 AI 公司也将发布具有相似能力的模型。这不仅压缩了网络防御方的准备窗口，也对现有的 AI 安全治理框架提出了严峻挑战。

最强模型Claude Mythos公开 | Anthropic | 暂不对公众开放 | 玻璃之翼计划 | 编程能力跃升 | HLE轻松第一 | token消耗20% | 网络攻击风险加剧

一、 Claude Mythos 的技术突破与性能飞跃

二、令人担忧的自主网络安全能力

三、玻璃之翼计划：受控的防御性开放

四、 AI 安全治理的新临界点

关键引用

最强模型Claude Mythos公开 | Anthropic | 暂不对公众开放 | 玻璃之翼计划 | 编程能力跃升 | HLE轻松第一 | token消耗20% | 网络攻击风险加剧

一、 Claude Mythos 的技术突破与性能飞跃

二、 令人担忧的自主网络安全能力

三、 玻璃之翼计划：受控的防御性开放

四、 AI 安全治理的新临界点

关键引用

二、令人担忧的自主网络安全能力

三、玻璃之翼计划：受控的防御性开放