下一代Claude该如何打造 | Alex Albert | 模型即产品 | 编程能力 | 产品一体化 | 自适应思考 | Dreaming | 性格训练 | 单向门和双向门决策

大家好，这里是最佳拍档，我是大飞 Anthropic的Claude究竟是如何打造出来的下一代的Claude又将如何发展呢？想要了解这些内容我觉得最好的信息来源就是Anthropic的内部开发人员 5月17日 Anthropic的现任研究产品经理Alex Albert 参加了Peter

Yang的一期播客从开发一线的视角拆解了Claude的全流程产研逻辑我们先来介绍一下Alex Albert 他是一位标准的00后在2023年年初他还只是美国华盛顿大学计算机系的一名普通学生出于对AI提示词工程的兴趣于是就独立搭建了一个名为jailbreakchat.com的网站

专门收集整理AI模型的越狱提示词这个网站上线后迅速在Reddit、Product Hunt等海外科技社区爆红也正是因为这个项目 Albert被Anthropic官方注意到

2023年年中，他正式加入Anthropic 成为公司历史上第一位提示词工程师（Prompt Engineer）之后凭借出色的能力晋升为Claude Relations负责人这个岗位类似行业内的开发者关系岗位在任期间

他推动了Claude系统提示词公开透明化、MCP协议、开发者工具生态等一系列关键举措而在这次播客录制时他已经转型为Anthropic研究团队的产品经理从模型构思的最初阶段就全程介入一直跟进到模型训练完成、正式发布是真正参与Claude核心研发的关键人物

而这期播客的主持人彼得·杨（Peter Yang）同样是科技产品领域的资深专家他现任Roblox的首席产品经理同时也运营着自己的Newsletter 订阅量超过14万 YouTube频道也有将近9万订阅他的职业履历覆盖微软、Meta、Twitch、Credit

Karma、Reddit等多家顶级科技公司拥有麻省理工学院斯隆商学院MBA学位与布朗大学应用数学经济学学位绝对可以称得上是产品经理圈子里的老炮两人的对话，上来也没有什么客套话直接全是亲身一线产研的经验所以觉得很有价值，给大家分享一下首先 Anthropic研发大模型的核心理念

跟传统的互联网公司不同那就是模型即产品在绝大多数AI研发机构的认知里大模型是一项研究成果是算法、算力和数据堆叠后的技术产出但是在Anthropic 整个团队从顶层就把模型当作了一款标准化的互联网产品来管理 Albert在播客中明确强调每一代新的Claude模型在启动训练之前

研究团队的产品经理就必须全程介入制定这套模型的完整产品需求文档清晰定义这款模型应该擅长什么核心能力需要在上一代模型的基础上完成哪些维度的提升要解决哪些用户痛点这种研发逻辑虽然和传统互联网产品

从需求调研到功能落地的流程几乎完全一致但是又有着大模型研发独有的特殊性 Anthropic会把Claude的核心能力拆分成多个明确的大类其中编程能力一直是团队长期聚焦的核心重点这也是Claude在开发者群体中口碑突出的关键原因而知识工作能力是最近几代模型重点加码的新方向

具体涵盖了使用Claude制作表格、撰写专业文档以及处理复杂办公任务等场景这也是Anthropic瞄准职场效率工具的核心布局和传统的产品开发不同 Albert 用了一个非常形象的比喻大模型研发就像是种庄稼一样研发团队可以选择种子、挑选土壤也就是确定模型架构、训练策略和数据方向

但是模型最终长成什么样子能力的分布如何必须等到训练流程完全跑完才能确定研究团队基于技术经验会对模型能力有初步的直觉但是模型的实际表现、能力短板和场景适配性只会在训练过程中逐步显现这也是大模型研发不可替代的不确定性

更关键的是 Anthropic的研究产品经理必须考虑模型在所有产品形态下的统一表现 Albert提到 Claude模型会通过API、Claude Code、Cowork等多种产品界面触达终端用户同一个底层模型在API中被开发者二次调用、在Claude

Code中完成代码编写、在Cowork中协助审核文档用户的使用场景、交互方式和体验预期是完全不同的这就意味着模型的能力不是孤立存在的必须和产品形态深度融合设计研究产品经理要全程考虑模型能力与不同产品界面的适配性而这种模型+产品一体化的设计思路其实是很多单纯聚焦技术的AI公司

完全忽略了的一个关键点也是Claude的用户体验能够持续领先的核心原因解决了模型的规划问题接下来就是大模型研发中最核心的环节如何基于海量用户的反馈来完成迭代 Anthropic每天有几百万人与Claude交互

用户反馈的数量如同消防水龙头涌出的水流一般人工完全无法处理而Anthropic给出的解决方案是用AI来修正AI 让Claude自己处理关于Claude的反馈 Albert的团队会直接调用Claude对海量的用户反馈做聚类分析自动提取反馈中的核心主题把零散的用户吐槽、建议、问题

转化为标准化的合成问题版本最终生成可以量化测试的评测指标（Eval）形成从用户反馈，到AI分析再到量化评测最终模型迭代的完整闭环为了让大家理解这个闭环的实际作用 Albert举了自适应思考（Adaptive Thinking）的典型案例自适应思考是最近几代Claude模型核心的新功能

它的作用是让模型自主判断什么时候需要深度思考、什么时候可以快速响应替代了之前需要用户手动开启的扩展思考（Extended Thinking）模式在迭代过程中用户会持续反馈两类问题

一部分简单问题，模型思考耗时过长浪费算力与响应时间另一部分复杂问题模型快速给出答案显得敷衍，无法满足用户需求这些碎片化的反馈都会被Claude自动聚类和提炼转化为针对性的评测指标指导研究团队持续调优自适应思考的判断逻辑这里还有一个反直觉的行业认知

Albert明确打破了评测用例越多越好的误区他表示模型评测（Eval）并不需要成千上万个测试用例有时候几十个精心设计、贴合真实用户场景的用例就足够了这些用例的核心价值不是覆盖所有的可能性而是精准证明模型存在的具体问题为研究团队提供明确的优化目标比如

单纯测试Claude能否数出图片中超过10个物体毫无意义真正有价值的评测是思考这个能力缺陷会如何影响用户的真实任务比如是否会导致用户无法完成数据统计或者文档处理等核心操作这种贴近真实场景的评测才是驱动模型迭代的真正抓手解决了能力迭代的问题

Anthropic最近对外公开的做梦（Dreaming）机制可以说是Claude记忆系统中最具突破性的设计也是让模型更贴近人类认知的关键创新 Albert解释，这套机制的设计灵感来源于人类梦境的主流科学理论人类的梦境是大脑的记忆再巩固过程负责整理白天接收的信息强化有效记忆，剔除无效冗余

而Anthropic把这个逻辑完整迁移到了Claude的Agent中当Agent没有执行用户任务、处于后台空闲状态的时候会自动遍历自身的记忆库查找记忆中的矛盾内容、清理过时信息、合并重复条目完成记忆的二次重构与优化这个过程和自适应思考能力高度关联 Albert举了一个非常通俗的例子

如果一个陌生人问你我现在应该做什么你只能给出泛泛的建议但如果是你的好友提问你会结合他的经历、兴趣、处境给出深度的建议模型也是同理，用户记忆越丰富整理的越清晰

模型在判断是否需要深度思考的时候就越精准当缺少用户上下文记忆的时候模型的思考判断必然出现大量偏差这套“记忆存储+做梦整理+自适应思考”的闭环让Claude从被动响应的聊天机器人正在向持续在线和主动理解用户的协作助手转变除了能力与记忆 Claude最让用户有感知的差异化优势

就是它独特的人格特质而这也是Anthropic投入了大量资源打磨的性格训练很多人误以为AI的人格是靠提示词设定出来的但是Albert明确辟谣道 Claude的性格不是装出来的是通过专项训练一步步打磨出来的 Anthropic内部有专职团队全程负责Claude的性格塑造核心解决三个问题

Claude应该如何表达自身观点、应该秉持怎样的价值观以及面对不同场景应该做出怎样的行为反应在AI发展早期很多从业者认为性格无关紧要觉得让AI完成任务即可不需要在意表达方式但是随着Agent技术的成熟

这个认知被彻底推翻当AI以Agent形态长期自主运行连续数小时执行任务、独立做出架构选择、技术判断和决策落地时模型的性格、品格和价值取向就会直接影响到最终的产品质量与用户信任度但是性格评估的难度远高于编程和知识等可量化的能力不存在简单的性格跑分工具 Anthropic的解决方案

是结合定量评估与定性判断定量层面让Claude自主评估自身的输出风格完成标准化打分定性层面要求研究员阅读成百上千条模型对话记录培养对模型语感的直觉捕捉对话中细微的表达差异比如是否过度迎合用户、是否敢于合理反驳、是否坚守价值底线这种量化+直觉的组合评估方式

是Claude形成稳定、可靠、不谄媚人格的核心秘诀随着Claude深度融入内部研发流程 AI也彻底重塑了Anthropic产品经理的工作方式 Albert分享了自己的实战变化也是AI原生产品经理的典型工作状态过去

产品经理想要获取功能用户数据必须提交需求给数据科学团队等待几天时间才能拿到分析结果决策流程被严重阻塞现在他只需要通过Claude Code连接公司产品数据库 10分钟内就能自主完成数据查询、日志分析和反馈汇总战略思考完全不会被数据获取卡住在日常工作中

Albert最常用的工具是Claude Cowork 他会把方案草稿和参考资料全部导入让Claude从不同角色视角质疑自己的假设指出论证漏洞更巧妙的是他会让Claude扮演两个立场相反的角色展开辩论自己通过观看辩论记录理清思路完成高效的头脑风暴在功能范围评估（Scoping）的环节

AI带来的变革则更加彻底过去产品经理需要花费大量时间与工程师沟通才能判断功能的实现难度而现在直接让Claude遍历代码库快速给出实现方案比如说，这个功能只需要修改10行代码、切换一个参数开关即可完成这种效率提升

直接改变了产品需求的优先级排序原本预估两周的需求现在发现10分钟就能完成优先级自然会大幅提升产品决策的灵活性跟之前完全不同在决策层面 Anthropic内部有一套核心的决策框架用来区分单向门（One-way door）决策与双向门（Two-way door）决策

这套框架也是AI时代产品研发的核心逻辑单向门决策指的是不可逆的决策一旦做出就无法轻易撤回典型案例就是模型架构选择因为大模型训练周期长达几个月需要投入海量算力、时间和人力资源架构一旦选择错误就会导致全盘皆输这类决策必须反复深思和充分论证而双向门决策指的是可逆的决策试错成本极低

典型案例就是代码编写和功能迭代代码写错可以快速修改、功能上线后可以快速回滚这类决策不需要过度纠结试错不行就重新调整 Albert强调，在AI编程时代工程实现已经不再是单向门决策代码的编写、重构和迭代成本大幅降低

可逆性极强如果一件事不是单向门决策可撤回、可调整那么在当下的研发流程中试错成本几乎为零而整个研发流程的瓶颈已经从工程实现转移到了协调与沟通代码生产可以被AI百倍加速但是发布前的战略对齐、用户沟通和跨团队协作依然需要人工完成 AI暂时还无法替代虽然编码环节的效率提升最为明显

但是战略思考、价值判断和组织协同依然是人类的核心价值所在和高效决策配套的是Anthropic内部浓厚的书面文化这套文化不仅适配人类协作更对AI极其友好 Anthropic的会议有一个标志性流程会议开始后所有参会者先花10-15分钟安静阅读文档在文档中直接撰写评论、标注疑问、展开讨论

全程无人说话完成书面沟通后再进行口头交流 Anthropic通过这种静默阅读+文档讨论的模式把隐性知识全部转化为书面文字把会议内容转录、工作流程文档化以及员工的入职流程全都标准化

所有信息都被完整记录下来 Albert表示这种书面文化的核心价值不仅是方便人类协作更是为Claude提供丰富的上下文语料库组织内的书面信息越多 Claude能获取的上下文越完整给出的辅助建议就越精准、越贴合团队的需求他也建议所有科技组织都推动隐性知识的书面化转化

因为这些文字不仅是给人看的更是给AI使用的是AI融入组织协作的基础在播客的最后两人聊到了AI领域最具争议的话题 Claude是否具备意识 Albert透露 Anthropic内部已经组建了专职研究团队全职研究Claude作为“有意识的行动者与Agent”的意义目前

Anthropic虽然还没有给出Claude有意识或无意识的官方立场但是团队依然坚持深度探索更重要的是即便无法得出意识的明确结论这项研究本身已经产生了巨大的价值通过研究Claude的思考逻辑、行为模式、决策偏好和心智模型

Anthropic团队能够更精准地理解模型行为进而优化产品设计让Claude的输出更可预测、更值得用户信任 Peter Yang提出了一个自己的担忧随着用户越来越信任AI 让模型长期自主执行任务人类无法全程监督那么模型的决策逻辑和价值取向就变得至关重要 Albert对此回应

当模型在帮用户编写全部代码、选择数据库、做出架构决策时用户必然需要对模型抱有足够的信任这也是团队打磨模型具有高品格和稳定性格的核心原因因为能力强大的同时价值判断的可靠才是下一代AI的核心竞争力总结下来这期播客给我们传递的核心信号是大模型行业正在经历的彻底转型接下来AI的竞争

不再是单纯技术参数的比拼而是产品化能力、用户信任度和Agent长期可靠性的综合竞争 Claude的产研逻辑或者可以为我们提供更多的实战参考但是由于Anthropic的特殊性大家在实际应用中

最好还是选择适合自己的方式并不能完全照搬Anthropic的产研逻辑感谢收看本期视频，我们下期再见

下一代Claude该如何打造 | Alex Albert | 模型即产品 | 编程能力 | 产品一体化 | 自适应思考 | Dreaming | 性格训练 | 单向门和双向门决策 | 书面文化 · 全文文字稿