核心人物与背景:从学生到Claude研发关键人物

本期内容源自Anthropic现任研究产品经理 Alex Albert 与Roblox首席产品经理 Peter Yang 的深度对谈。Alex Albert是一位典型的“00后”天才,2023年初他还是华盛顿大学计算机系学生,因独立搭建收集AI越狱提示词的网站 jailbreakchat.com 而在Reddit和Product Hunt爆红,由此被Anthropic注意到。2023年年中,他加入Anthropic成为公司历史上 第一位提示词工程师,随后晋升为Claude Relations负责人,推动了系统提示词公开透明化、MCP协议及开发者工具生态建设。在播客录制时,他已转型为研究团队产品经理,全程介入从模型构思到训练发布的核心研发环节。

主持人Peter Yang同样是科技产品领域的资深专家,拥有麻省理工学院斯隆商学院MBA学位及布朗大学应用数学经济学学位,曾在微软、Meta、Twitch等顶级科技公司任职,其Newsletter订阅量超14万,YouTube频道近9万订阅。两人的对话摒弃客套,直接切入一线产研经验,为理解Claude的底层逻辑提供了极具价值的内部视角。

核心理念:模型即产品与不确定性管理

Anthropic研发大模型的核心理念与传统互联网公司截然不同,即 “模型即产品”。在大多数AI机构眼中,大模型是算法、算力和数据堆叠后的技术产出,但在Anthropic,团队从顶层将模型视为标准化互联网产品进行管理。Albert强调,每一代新Claude模型在启动训练前,产品经理必须全程介入,制定完整的产品需求文档(PRD),清晰定义模型应擅长的核心能力、需提升的维度及需解决的用户痛点。

这种研发逻辑虽与传统互联网产品流程一致,但具有大模型独有的特殊性。Albert用 “种庄稼” 比喻大模型研发:团队可以选择种子(模型架构)、挑选土壤(训练策略和数据方向),但模型最终长成什么样子、能力分布如何,必须等到训练流程完全跑完才能确定。研究团队虽有技术直觉,但模型的实际表现、短板和场景适配性仅在训练过程中显现,这种 不可替代的不确定性 是研发的核心特征。

“每一代新的Claude模型在启动训练之前,研究团队的产品经理就必须全程介入,制定这套模型的完整产品需求文档。”

能力拆解与产品一体化设计

Anthropic将Claude的核心能力拆分为多个明确大类,其中 编程能力 是长期聚焦的核心重点,也是Claude在开发者群体中口碑突出的关键;而 知识工作能力 是最近几代模型重点加码的新方向,涵盖制作表格、撰写专业文档及处理复杂办公任务,瞄准职场效率工具布局。

更关键的是,研究产品经理必须考虑模型在 所有产品形态下的统一表现。Claude通过API、Claude Code、Cowork等多种界面触达用户,同一底层模型在不同场景下(API二次调用、代码编写、文档审核)的用户体验预期完全不同。这意味着 模型能力不是孤立存在的,必须与产品形态深度融合设计。这种“模型+产品一体化”思路是许多单纯聚焦技术的AI公司忽略的关键点,也是Claude用户体验持续领先的核心原因。

迭代闭环:用AI修正AI与自适应思考

Anthropic每天面临数百万用户交互产生的海量反馈,人工无法处理,因此采用 “用AI来修正AI” 的解决方案。团队调用Claude对海量用户反馈进行聚类分析,自动提取核心主题,将零散吐槽转化为标准化合成问题,最终生成可量化测试的评测指标(Eval),形成从反馈到迭代的完整闭环。

自适应思考(Adaptive Thinking) 是该闭环的典型成果,它让模型自主判断何时深度思考、何时快速响应,替代了手动开启的扩展思考模式。用户反馈两类问题:简单问题耗时过长浪费算力,复杂问题快速回答显得敷衍。这些碎片化反馈被自动提炼,指导团队调优判断逻辑。Albert打破行业误区,指出 评测用例无需成千上万,几十个贴合真实场景的精心设计用例足以证明具体问题,核心价值在于精准定位缺陷对真实任务的影响,而非覆盖所有可能性。

“模型评测(Eval)并不需要成千上万个测试用例,有时候几十个精心设计、贴合真实用户场景的用例就足够了。”

记忆系统突破:做梦机制(Dreaming)

Anthropic最近公开的 做梦(Dreaming)机制 是Claude记忆系统的突破性设计,灵感来源于人类梦境的记忆再巩固理论。当Agent处于后台空闲状态时,会自动遍历记忆库,查找矛盾内容、清理过时信息、合并重复条目,完成记忆的二次重构与优化。

这一机制与自适应思考高度关联。Albert举例:陌生人提问只能给泛泛建议,好友提问则结合经历给出深度建议。用户记忆越丰富、整理越清晰,模型判断是否需要深度思考就越精准。缺少上下文记忆时,思考判断必然出现偏差。这套“记忆存储+做梦整理+自适应思考”的闭环,让Claude从被动聊天机器人向 持续在线和主动理解用户的协作助手 转变。

性格训练:非提示词设定的深层打磨

Claude独特的 人格特质 是用户感知的差异化优势,这源于Anthropic投入大量资源的 性格训练。Albert辟谣称,Claude的性格不是靠提示词装出来的,而是通过专项训练一步步打磨出来的。内部有专职团队负责解决三个核心问题:如何表达观点、秉持何种价值观、面对不同场景的行为反应。

早期从业者认为性格无关紧要,但随着Agent技术成熟,当AI长期自主运行、独立做出架构选择和技术判断时,模型的品格和价值取向直接影响产品质量与用户信任度。性格评估难度高于编程等量化能力,Anthropic采用 定量评估与定性判断结合 的方式:定量层面让Claude自主评估输出风格并打分;定性层面要求研究员阅读大量对话记录,培养对语感的直觉,捕捉是否过度迎合、是否敢于合理反驳等细微差异。这种组合是Claude形成 稳定、可靠、不谄媚人格 的核心秘诀。

AI重塑PM工作流:从数据阻塞到敏捷决策

Claude深度融入Anthropic内部研发流程,彻底重塑了产品经理的工作方式。过去,PM获取功能用户数据需提交需求给数据科学团队,等待数天,决策流程严重阻塞。现在,Albert只需通过 Claude Code连接公司产品数据库10分钟内 即可自主完成数据查询、日志分析和反馈汇总,战略思考不再被数据获取卡住。

在日常工作中,Albert常用 Claude Cowork 导入方案草稿和参考资料,让Claude从不同角色视角质疑假设、指出漏洞,甚至扮演对立角色展开辩论,通过观看辩论记录理清思路,完成高效头脑风暴。在 功能范围评估(Scoping) 环节,AI带来彻底变革:过去需花费大量时间与工程师沟通判断实现难度,现在直接让Claude遍历代码库,快速给出实现方案。例如,某功能可能只需修改10行代码或切换一个参数开关即可完成。这种效率提升直接改变了需求优先级排序,原本预估两周的需求若发现10分钟可完成,优先级自然大幅提升,产品决策灵活性发生根本性变化。

决策框架:单向门与双向门逻辑

在决策层面,Anthropic内部采用 单向门(One-way door)双向门(Two-way door) 决策框架,这是AI时代产品研发的核心逻辑。

  • 单向门决策:指不可逆决策,一旦做出无法轻易撤回。典型案例是 模型架构选择,因大模型训练周期长达数月,需投入海量算力、时间和人力,架构错误会导致全盘皆输。此类决策必须反复深思和充分论证。
  • 双向门决策:指可逆决策,试错成本极低。典型案例是 代码编写和功能迭代,代码写错可快速修改,功能上线后可快速回滚。此类决策无需过度纠结,试错不行即调整。

Albert强调,在AI编程时代,工程实现已不再是单向门决策,代码编写、重构和迭代成本大幅降低,可逆性极强。如果一件事可撤回、可调整,试错成本几乎为零。研发流程的瓶颈已从工程实现转移到 协调与沟通。代码生产可被AI百倍加速,但发布前的战略对齐、用户沟通和跨团队协作仍需人工完成,AI暂时无法替代。尽管编码效率提升明显,但 战略思考、价值判断和组织协同 依然是人类的核心价值所在。

书面文化与意识探索:AI协作的基础

与高效决策配套的是Anthropic内部浓厚的 书面文化,这套文化不仅适配人类协作,更对AI极其友好。会议标志性流程是:开始后所有参会者先花10-15分钟安静阅读文档,在文档中直接撰写评论、标注疑问、展开讨论,全程无人说话,完成书面沟通后再进行口头交流。这种模式将隐性知识转化为书面文字,把会议内容转录、工作流程文档化,入职流程也标准化,所有信息完整记录。

Albert指出,书面文化的核心价值不仅是方便人类协作,更是为Claude提供丰富的 上下文语料库。组织内书面信息越多,Claude获取的上下文越完整,辅助建议越精准。他建议科技组织推动隐性知识书面化,因为这些文字不仅是给人看的,更是给AI使用的,是AI融入组织协作的基础。

在播客最后,两人探讨了Claude是否具备意识。Anthropic已组建专职研究团队,全职研究Claude作为“有意识的行动者与Agent”的意义。虽未给出官方立场,但深度探索本身产生巨大价值:通过研究思考逻辑、行为模式、决策偏好和心智模型,团队能更精准理解模型行为,优化产品设计,使输出更可预测、更值得信任。面对用户信任AI长期自主执行任务的担忧,Albert回应,当模型帮助编写代码、选择数据库、做出架构决策时,用户必然需要足够信任,这也是团队打磨模型 高品格和稳定性格 的核心原因,因为 能力强大的同时,价值判断的可靠才是下一代AI的核心竞争力

“当模型在帮用户编写全部代码、选择数据库、做出架构决策时,用户必然需要对模型抱有足够的信任。这也是团队打磨模型具有高品格和稳定性格的核心原因。”