就在今天,Anthropic 发布了新一代旗舰模型 Claude Opus 4.7,价格没变,上下文也没变,但它在写代码这件事上比上一代 Opus 4.6 强了不少。大家好,我是小木头,今天咱们就花几分钟来聊聊这次的更新。总的来说,Opus 4.7 编程更强,看图更清,更听话。如果你是开发者,这次是值得立刻换上的更新。

如果你只是日常用 Claude 聊天、写文案,感受可能不会那么明显,但也不吃亏,毕竟价格完全没涨。这次 Anthropic 主打的卖点就是编程能力。在业界最公认的编程测试SWE Bench Pro,OPPO 4.7拿到了六十四点三分,而上一代OPPO 4.6只有五十三点四分。一次小版本升级涨了差不多十一个点,这个幅度其实蛮夸张的。

在已经全面发布的大模型里,它在这个榜单上重新拿回了第一。GPT 5.4是五十七点七,Gemini 3.1 Pro是五十四点二。更直观的感受是什么呢?以前让 Claude 改一个跨多个文件的 bug。有时它会改着改着跑偏,或者说我改完了,结果根本没跑通。OPPO 4.7 一个很明显的变化是,它会自己验证结果,做完一件事,它会主动跑一下、查一下,确认真的没问题再告诉你。

用官方的话说就是。它会想办法验证自己的输出。第二个亮点是识别图像的能力,更通俗的讲,它看图更清楚了。这是 Claude 第一次支持高分辨率图片。以前你截一张稍微密一点的屏幕发给 Claude,比如一整个 dashboard、一页代码、一张密密麻麻的 Excel 表,它经常看不清小字。不知道大家平时在使用中有没有发现这个问题呢?

原因是之前所有的 Claude 模型都会把图压缩到一百一十五万像素以内, Claude 4.7 把这个上限提高到了三百七十五万像素,差不多是之前的三倍。效果有多明显呢?官方发了一张图,专门测让模型从截屏里找到要点的那个按钮。同样是 OPUS 4.7,用低分辨率时识别准确率是百分之六十九,切到高分辨率直接跳到了百分之七十九点五。

就因为它终于能看清楚了,那它对什么场景最有用呢?读长截图、读仪表盘、分析密集的表格和图表,给AI做computer use,也就是让它操作你的电脑这类任务,对看清屏幕要求特别高。第三个亮点是它更听话了。这一点没有具体数字,但 Anthropic 专门强调了,Opus 4.7 会更加严格地按照你的指令来。

你说不要加注释,它就真的不加;你说只改这一个函数,它不会顺手重构周围的代码。这里有一个副作用要提醒一下:如果你之前写过很详细的 prompt,也就是提示词给 Opus 4.6 用,换到 4.7 上可能需要微调。因为现在他会更加按照字面的意思来理解你的话。再分享一些值得大家注意的事项。首先呢是价格没变,输入每百万 token 五美元,输出二十五美元,这跟四点六完全一样。

上下文窗口还是一百万 token,这是四点六时代就有的,四点七继续保留。在 API 中,模型 ID 是 Claude Dash Opus Dash For Dash Seven。在这款模型中,还有一个新特性叫 Adaptive Thinking。以前你要手动指定给模型多少 token 来思考,现在模型自己根据任务难度来决定要想多久。

简单问题秒答,复杂问题多想一会儿。从程序化的角度讲,我们可以通过下面这一段 Python 代码。来看看如何在模型中使用 adaptive thinking。随着新模型的发布,那么该不该立刻换呢?我的建议是,如果你用 ClovCode 写代码,立即换。十个点的提升是真实能感觉到的。如果你在做 agent 做自动化任务,立即换,它会自我验证,更听话,看图更清,这三点对 agent 至关重要。

如果你日常只是聊天、写文案,我想可能不用那么着急,反正价格没涨,需要的时候用上就行了。这次 Open 4.7 不是一次革命性的升级,Anthropic 自己也没有把它吹成改变一切,但在编程、视觉、指令遵循这些最影响日常使用体验的事情上,它都给出了看得见的改进,而且价格不变,对开发者来说这就是一次很划算的免费升级。

好了,今天的分享就到这里吧。大家在四点七的使用上有什么心得呢?欢迎在评论区留言。那我们下期再见。