Claude Fable 5 目前体验不错,但我觉得它相比 GPT-5.5 或 Opus 4.8 还没实现质的飞跃。
我最大的槽点是:处理旧的 AI 研究论文/博客或基础问题时,经常会自动降级到 Opus 4.8。
Anthropic 昨晚表示不会再进行“静默模型切换”了(这很好),但请不要削弱对基础 AI 研究或生物学问题的处理能力。
Opus 4.8 在 SWE-Bench Pro 测试中得分 69.2%,比 GPT-5.5 高出 10 个百分点。
发布日志中最引人注目的部分是“动态工作流”(Dynamic Workflows):
“这项目前处于研究预览阶段的新功能,让 Claude 能够在 Claude Code 中处理规模更大的任务。Claude 可以规划工作流程,并在单次会话中运行数百个并行子代理(在 Opus 4.8 中,这些代理的运行时间可以更长)。在向用户反馈结果之前,它还会对输出内容进行验证。”