大家好,这里是最佳拍档,我是大飞 Anthropic的Claude究竟是如何打造出来的 下一代的Claude又将如何发展呢?想要了解这些内容 我觉得最好的信息来源就是Anthropic的内部开发人员 5月17日 Anthropic的现任研究产品经理Alex Albert 参加了Peter

Yang的一期播客 从开发一线的视角 拆解了Claude的全流程产研逻辑 我们先来介绍一下Alex Albert 他是一位标准的00后 在2023年年初 他还只是美国华盛顿大学计算机系的一名普通学生 出于对AI提示词工程的兴趣 于是就独立搭建了一个名为jailbreakchat.com的网站

专门收集整理AI模型的越狱提示词 这个网站上线后迅速在Reddit、Product Hunt等海外科技社区爆红 也正是因为这个项目 Albert被Anthropic官方注意到

2023年年中,他正式加入Anthropic 成为公司历史上第一位提示词工程师(Prompt Engineer) 之后凭借出色的能力 晋升为Claude Relations负责人 这个岗位类似行业内的开发者关系岗位 在任期间

他推动了Claude系统提示词公开透明化、MCP协议、开发者工具生态等一系列关键举措 而在这次播客录制时 他已经转型为Anthropic研究团队的产品经理 从模型构思的最初阶段就全程介入 一直跟进到模型训练完成、正式发布 是真正参与Claude核心研发的关键人物

而这期播客的主持人彼得·杨(Peter Yang) 同样是科技产品领域的资深专家 他现任Roblox的首席产品经理 同时也运营着自己的Newsletter 订阅量超过14万 YouTube频道也有将近9万订阅 他的职业履历覆盖微软、Meta、Twitch、Credit

Karma、Reddit等多家顶级科技公司 拥有麻省理工学院斯隆商学院MBA学位 与布朗大学应用数学经济学学位 绝对可以称得上是产品经理圈子里的老炮 两人的对话,上来也没有什么客套话 直接全是亲身一线产研的经验 所以觉得很有价值,给大家分享一下 首先 Anthropic研发大模型的核心理念

跟传统的互联网公司不同 那就是模型即产品 在绝大多数AI研发机构的认知里 大模型是一项研究成果 是算法、算力和数据堆叠后的技术产出 但是在Anthropic 整个团队从顶层就把模型当作了一款标准化的互联网产品来管理 Albert在播客中明确强调 每一代新的Claude模型在启动训练之前

研究团队的产品经理就必须全程介入 制定这套模型的完整产品需求文档 清晰定义这款模型应该擅长什么核心能力 需要在上一代模型的基础上完成哪些维度的提升 要解决哪些用户痛点 这种研发逻辑 虽然和传统互联网产品

从需求调研到功能落地的流程几乎完全一致 但是又有着大模型研发独有的特殊性 Anthropic会把Claude的核心能力 拆分成多个明确的大类 其中编程能力一直是团队长期聚焦的核心重点 这也是Claude在开发者群体中口碑突出的关键原因 而知识工作能力 是最近几代模型重点加码的新方向

具体涵盖了使用Claude制作表格、撰写专业文档 以及处理复杂办公任务等场景 这也是Anthropic瞄准职场效率工具的核心布局 和传统的产品开发不同 Albert 用了一个非常形象的比喻 大模型研发就像是种庄稼一样 研发团队可以选择种子、挑选土壤 也就是确定模型架构、训练策略和数据方向

但是模型最终长成什么样子 能力的分布如何 必须等到训练流程完全跑完才能确定 研究团队基于技术经验 会对模型能力有初步的直觉 但是模型的实际表现、能力短板和场景适配性 只会在训练过程中逐步显现 这也是大模型研发不可替代的不确定性

更关键的是 Anthropic的研究产品经理 必须考虑模型在所有产品形态下的统一表现 Albert提到 Claude模型会通过API、Claude Code、Cowork等多种产品界面触达终端用户 同一个底层模型 在API中被开发者二次调用、在Claude

Code中完成代码编写、在Cowork中协助审核文档 用户的使用场景、交互方式和体验预期是完全不同的 这就意味着 模型的能力不是孤立存在的 必须和产品形态深度融合设计 研究产品经理要全程考虑模型能力与不同产品界面的适配性 而这种模型+产品一体化的设计思路 其实是很多单纯聚焦技术的AI公司

完全忽略了的一个关键点 也是Claude的用户体验能够持续领先的核心原因 解决了模型的规划问题 接下来就是大模型研发中最核心的环节 如何基于海量用户的反馈来完成迭代 Anthropic每天有几百万人与Claude交互

用户反馈的数量如同消防水龙头涌出的水流一般 人工完全无法处理 而Anthropic给出的解决方案 是用AI来修正AI 让Claude自己处理关于Claude的反馈 Albert的团队 会直接调用Claude对海量的用户反馈做聚类分析 自动提取反馈中的核心主题 把零散的用户吐槽、建议、问题

转化为标准化的合成问题版本 最终生成可以量化测试的评测指标(Eval) 形成从用户反馈,到AI分析 再到量化评测 最终模型迭代的完整闭环 为了让大家理解这个闭环的实际作用 Albert举了自适应思考(Adaptive Thinking)的典型案例 自适应思考是最近几代Claude模型核心的新功能

它的作用是让模型自主判断什么时候需要深度思考、什么时候可以快速响应 替代了之前需要用户手动开启的扩展思考(Extended Thinking)模式 在迭代过程中 用户会持续反馈两类问题

一部分简单问题,模型思考耗时过长 浪费算力与响应时间 另一部分复杂问题 模型快速给出答案 显得敷衍,无法满足用户需求 这些碎片化的反馈 都会被Claude自动聚类和提炼 转化为针对性的评测指标 指导研究团队持续调优自适应思考的判断逻辑 这里还有一个反直觉的行业认知

Albert明确打破了评测用例越多越好的误区 他表示 模型评测(Eval)并不需要成千上万个测试用例 有时候几十个精心设计、贴合真实用户场景的用例就足够了 这些用例的核心价值 不是覆盖所有的可能性 而是精准证明模型存在的具体问题 为研究团队提供明确的优化目标 比如

单纯测试Claude能否数出图片中超过10个物体毫无意义 真正有价值的评测 是思考这个能力缺陷会如何影响用户的真实任务 比如是否会导致用户无法完成数据统计或者文档处理等核心操作 这种贴近真实场景的评测 才是驱动模型迭代的真正抓手 解决了能力迭代的问题

Anthropic最近对外公开的做梦(Dreaming)机制 可以说是Claude记忆系统中最具突破性的设计 也是让模型更贴近人类认知的关键创新 Albert解释,这套机制的设计灵感 来源于人类梦境的主流科学理论 人类的梦境是大脑的记忆再巩固过程 负责整理白天接收的信息 强化有效记忆,剔除无效冗余

而Anthropic把这个逻辑完整迁移到了Claude的Agent中 当Agent没有执行用户任务、处于后台空闲状态的时候 会自动遍历自身的记忆库 查找记忆中的矛盾内容、清理过时信息、合并重复条目 完成记忆的二次重构与优化 这个过程和自适应思考能力高度关联 Albert举了一个非常通俗的例子

如果一个陌生人问你 我现在应该做什么 你只能给出泛泛的建议 但如果是你的好友提问 你会结合他的经历、兴趣、处境给出深度的建议 模型也是同理,用户记忆越丰富 整理的越清晰

模型在判断是否需要深度思考的时候就越精准 当缺少用户上下文记忆的时候 模型的思考判断必然出现大量偏差 这套“记忆存储+做梦整理+自适应思考”的闭环 让Claude从被动响应的聊天机器人 正在向持续在线和主动理解用户的协作助手转变 除了能力与记忆 Claude最让用户有感知的差异化优势

就是它独特的人格特质 而这也是Anthropic投入了大量资源打磨的性格训练 很多人误以为AI的人格是靠提示词设定出来的 但是Albert明确辟谣道 Claude的性格不是装出来的 是通过专项训练一步步打磨出来的 Anthropic内部有专职团队 全程负责Claude的性格塑造 核心解决三个问题

Claude应该如何表达自身观点、应该秉持怎样的价值观 以及面对不同场景应该做出怎样的行为反应 在AI发展早期 很多从业者认为性格无关紧要 觉得让AI完成任务即可 不需要在意表达方式 但是随着Agent技术的成熟

这个认知被彻底推翻 当AI以Agent形态长期自主运行 连续数小时执行任务、独立做出架构选择、技术判断和决策落地时 模型的性格、品格和价值取向 就会直接影响到最终的产品质量与用户信任度 但是性格评估的难度 远高于编程和知识等可量化的能力 不存在简单的性格跑分工具 Anthropic的解决方案

是结合定量评估与定性判断 定量层面 让Claude自主评估自身的输出风格 完成标准化打分 定性层面 要求研究员阅读成百上千条模型对话记录 培养对模型语感的直觉 捕捉对话中细微的表达差异 比如是否过度迎合用户、是否敢于合理反驳、是否坚守价值底线 这种量化+直觉的组合评估方式

是Claude形成稳定、可靠、不谄媚人格的核心秘诀 随着Claude深度融入内部研发流程 AI也彻底重塑了Anthropic产品经理的工作方式 Albert分享了自己的实战变化 也是AI原生产品经理的典型工作状态 过去

产品经理想要获取功能用户数据 必须提交需求给数据科学团队 等待几天时间才能拿到分析结果 决策流程被严重阻塞 现在 他只需要通过Claude Code连接公司产品数据库 10分钟内就能自主完成数据查询、日志分析和反馈汇总 战略思考完全不会被数据获取卡住 在日常工作中

Albert最常用的工具是Claude Cowork 他会把方案草稿和参考资料全部导入 让Claude从不同角色视角质疑自己的假设 指出论证漏洞 更巧妙的是 他会让Claude扮演两个立场相反的角色展开辩论 自己通过观看辩论记录理清思路 完成高效的头脑风暴 在功能范围评估(Scoping)的环节

AI带来的变革则更加彻底 过去产品经理需要花费大量时间与工程师沟通 才能判断功能的实现难度 而现在直接让Claude遍历代码库 快速给出实现方案 比如说,这个功能只需要修改10行代码、切换一个参数开关即可完成 这种效率提升

直接改变了产品需求的优先级排序 原本预估两周的需求 现在发现10分钟就能完成 优先级自然会大幅提升 产品决策的灵活性跟之前完全不同 在决策层面 Anthropic内部有一套核心的决策框架 用来区分单向门(One-way door)决策与双向门(Two-way door)决策

这套框架也是AI时代产品研发的核心逻辑 单向门决策指的是不可逆的决策 一旦做出就无法轻易撤回 典型案例就是模型架构选择 因为大模型训练周期长达几个月 需要投入海量算力、时间和人力资源 架构一旦选择错误就会导致全盘皆输 这类决策必须反复深思和充分论证 而双向门决策指的是可逆的决策 试错成本极低

典型案例就是代码编写和功能迭代 代码写错可以快速修改、功能上线后可以快速回滚 这类决策不需要过度纠结 试错不行就重新调整 Albert强调,在AI编程时代 工程实现已经不再是单向门决策 代码的编写、重构和迭代成本大幅降低

可逆性极强 如果一件事不是单向门决策 可撤回、可调整 那么在当下的研发流程中 试错成本几乎为零 而整个研发流程的瓶颈 已经从工程实现转移到了协调与沟通 代码生产可以被AI百倍加速 但是发布前的战略对齐、用户沟通和跨团队协作 依然需要人工完成 AI暂时还无法替代 虽然编码环节的效率提升最为明显

但是战略思考、价值判断和组织协同 依然是人类的核心价值所在 和高效决策配套的 是Anthropic内部浓厚的书面文化 这套文化不仅适配人类协作 更对AI极其友好 Anthropic的会议有一个标志性流程 会议开始后 所有参会者先花10-15分钟安静阅读文档 在文档中直接撰写评论、标注疑问、展开讨论

全程无人说话 完成书面沟通后再进行口头交流 Anthropic通过这种静默阅读+文档讨论的模式 把隐性知识全部转化为书面文字 把会议内容转录、工作流程文档化 以及员工的入职流程全都标准化

所有信息都被完整记录下来 Albert表示 这种书面文化的核心价值 不仅是方便人类协作 更是为Claude提供丰富的上下文语料库 组织内的书面信息越多 Claude能获取的上下文越完整 给出的辅助建议就越精准、越贴合团队的需求 他也建议所有科技组织 都推动隐性知识的书面化转化

因为这些文字不仅是给人看的 更是给AI使用的 是AI融入组织协作的基础 在播客的最后 两人聊到了AI领域最具争议的话题 Claude是否具备意识 Albert透露 Anthropic内部已经组建了专职研究团队 全职研究Claude作为“有意识的行动者与Agent”的意义 目前

Anthropic虽然还没有给出Claude有意识或无意识的官方立场 但是团队依然坚持深度探索 更重要的是 即便无法得出意识的明确结论 这项研究本身已经产生了巨大的价值 通过研究Claude的思考逻辑、行为模式、决策偏好和心智模型

Anthropic团队能够更精准地理解模型行为 进而优化产品设计 让Claude的输出更可预测、更值得用户信任 Peter Yang提出了一个自己的担忧 随着用户越来越信任AI 让模型长期自主执行任务 人类无法全程监督 那么模型的决策逻辑和价值取向就变得至关重要 Albert对此回应

当模型在帮用户编写全部代码、选择数据库、做出架构决策时 用户必然需要对模型抱有足够的信任 这也是团队打磨模型具有高品格和稳定性格的核心原因 因为能力强大的同时 价值判断的可靠 才是下一代AI的核心竞争力 总结下来 这期播客给我们传递的核心信号 是大模型行业正在经历的彻底转型 接下来AI的竞争

不再是单纯技术参数的比拼 而是产品化能力、用户信任度和Agent长期可靠性的综合竞争 Claude的产研逻辑 或者可以为我们提供更多的实战参考 但是由于Anthropic的特殊性 大家在实际应用中

最好还是选择适合自己的方式 并不能完全照搬Anthropic的产研逻辑 感谢收看本期视频,我们下期再见