欢迎收听跨国串门计划,这是一档专注于让中文听众无障碍欣赏全球优质外语播客的节目。通过先进的 AI 声纹克隆技术,我们不仅将内容翻译成中文,还完美保留了原主持人和嘉宾的独特声音,为您呈现全球顶尖的 AI 财经、健康与科技领域精品内容。我是主播一凯,一位热衷于 AI 领域的产品经理,很荣幸能为您搭建这座跨越语言障碍的桥梁。

接下来,让我为您简单介绍本期我们克隆的这档节目,并分享几句非常精彩的原话。本期我们克隆的是二零二六年六月二日更新的 Acquired Unplugged, presented by Work OS。这是一档偏商业与科技深度访谈的播客。主持人 Ben Gilbert 和 David Rosenfeld

这次请到 Anthropic 的技术员工 Boris Cherny 聊 Claude Code 的起源,以及 AI 正在怎样改变工程团队的工作方式。

节目里有几句原话很有代表性。当时有一种很强烈的感觉,就是产品还没跟上模型能力。编程是模型和现实世界互动的一种方式。到了十一月,我把我的 IDE 卸载了,因为我已经不用它了。我觉得现在就是通才的黄金时代。这些话背后有很多具体故事,那我们就一起来听听这期完整对话。好,我们需要听听起源故事。Claude Code 是从哪儿来的?

顺便说一句,坐在这里听到你们的声音,感觉真的很奇妙,因为我平时都是从耳机里听你们,而且大概还是二倍速听,大概还是二倍速,二倍速。而且还听不到我们后期剪掉的那些口头小毛病,还有各种停顿。这件事在很多方面都算是个意外。我是在二零二四年底加入 Anthropic 的一个团队,那有点像一个原型团队,叫 Labs 团队。

后来我们又把这个团队恢复了。当时的想法是,弄清楚下一个重要产品会是什么。与此同时,我们也要把模型能力往前推,弄清楚怎么改进模型才能最好的支持那个还没被做出来的未来产品。但要知道模型该往哪个方向演进,其实很难,因为在真正有一个产品把边界推到前面之前,你并不知道答案。当时有一种很强烈的感觉,就是产品还没跟上模型能力,模型已经能做很多事了,但还没有哪个产品真正把这些能力承接下来。

如果你看当时的编程工具,主要还是自动补全工具,也有那种你可以向 agent 提问的工具,但它还不能真正写代码。直到不久前,模型本身也还不够好,确实做不到。所以我们觉得这里有空间,可以全力做一个产品,就是一个编程 agent。我们把它做出来了,但一开始其实挺糟的。有一段时间,它大概只能帮我写百分之十到二十的代码。

我先快速问一下,在这个时间点之前,Anthropic 内部的编程状态是什么样的?这件事有多重要?当时 Anthropic 内部我们还是在用 IDE,但作为一家公司,Anthropic 一直很重视编程,我们一直重视工具使用,也一直重视计算机使用,这一直是核心研究方向之一。因为对我们来说,我们存在的目的就是研究 AI 安全,这就是我们存在的理由。

如果你在Anthropic随便找一个人,在走廊里拦住他,问他为什么在这里,他会说AI安全。公司里的每一个人都是因为这个原因在这里,大家都非常相信这一点,包括我。这是最重要、最需要解决的问题。解决它有很多方式,你可以研究机械可解释性,也可以做对齐工作。你可以用各种方式在培养模拟研究模型,但从根本上说,你也必须在真实环境里研究它,看看它在其他方面都足够安全之后,实际会做什么。

这就是 Claude Code 进入这个问题的地方。作为一家公司,Anthropic 的方向一直是安全,而研究安全有很多层次,其中就包括在真实环境里研究模型。那么,有什么有用的方式可以做到这一点?答案就是编程。因为编程是模型和现实世界互动的一种方式。如果你想研究各种模型不对齐的问题,就要先让它足够有用,让人们愿意使用它,这样你才能研究它。

编程就是一个非常明显的应用。所以从一开始,这就是我们的重点。这是一个特别干净的世界,因为你有大量训练数据,结果要么能跑,要么不能跑,而且根据不同语言,它要么能编译,要么不能编译。总之,你有一种很清楚的通过或失败的测试方式。同时,正确解的范围也非常受约束。英语就不一样,正确又漂亮的诗可以有无数种,但要写出解决某个问题的正确代码方式是很受约束的,不是无限多。

所以把编程当做你的培养皿,确实有一种优雅感。没错,你知道 Hofstadter 吧?就是写 Go to Asher Back 的那个人。知道,知道,很棒。那本书真的很好,不过他在八十年代还写过另一本很奇怪的书,讲他对通向人工智能之路的看法,因为他是教授,在学校。教AI当时也在做这方面教学,他当时讲的是认知的基础,智能的基础就是识别模式。

他研究这件事的一种方式来自他的一个爱好,把诗从英语翻译成法语,直接翻译并不一定是真正正确的翻译。这里面其实有很多品味,有时候你会想稍微变通一下,让韵律更好。做法有很多种,这是一个模糊的问题,但编程更容易解决。我觉得他在商业上也非常有价值。所以它能帮我们建立一门业务,而且这类业务正好也是我们最喜欢的客户会需要的,比如企业、创业公司。

这也让我们拥有一种更一致的商业模式。这样我们就不需要做广告,可以专注在安全上,也就是我们真正关心的事。它帮助我们建立一门业务,让我们真的能去做这件事。你来Anthropic之前是在Meta。而且你在 Meta 的很多工作都和代码有关,我很好奇,现在回头把这些点连起来看,你在 Meta 做的事是怎么影响 Claude Code 早期形成的?

对我来说,做开发工具一直都是副业,从来不是主业。我觉得这反而是做开发工具最好的方式,因为你要专注解决一个业务问题,做出一个大家喜欢、对大家有用的东西。这本来就是我们作为工程师来这里的根本原因,至少YC会一直把这一点灌输给你。我自己也是这么想的。你以前参加过YC吗?参加过。其实我是一个YC创业公司的第一位员工,那大概是在2010年、2011年左右,算是比较早的几批。

所以对我来说,开发工具一直是这种副业。我会先做产品,在做产品的过程中,如果开发体验不好,我就会做一些工具,把体验稍微改善一点。我一直都是这么做的,所以这次我也是用同样的思路,先给自己做一个东西,然后希望它也能帮到别人。结果我很惊讶的发现,它真的有用,这很棒。你刚才说它一开始。啊,其实挺糟的。你只敢把大概百分之十的工作交给他,他也只能完成你大概百分之十的工作。

那早期的瓶颈是什么?你们后来怎么解决让他变得更好?因为据我了解,你在现在这份工作里已经大概六个月没有亲手写过一行代码了,这和他只能做百分之十。差别太大了,中间发生了什么变化?我记得是在五月,当时是 Sonnet 四和 Opus,然后到十一月是 Open 四点五,所以就是底层模型变了,是模型变了。当然,Harness 上也做了很多工作,我们也花了很多精力让 Claude Code 变得更好。

大家使用这类东西的方式都不一样。给工程师做产品,特点就在这里,它不是消费级产品,因为工程师对自己怎么用工具都特别有主见,所以我们一开始做的是 CLI,后来又做了桌面应用、移动应用,我们做了 iOS 和 Android 应用,也有 Slack 应用、GitHub 应用,你可以用任何自己想要的方式使用 Claude Code,所以这里面很多工作都是我们在创新、学习,试着弄清楚哪些功能真的有用。

比如 Plan Mode 就是这么来的,很多不同的工具和体验也是这么来的。但从根本上说,如果我看模型替我写了多少比例的代码,真正带来阶跃式变化的还是模型本身。模型变好了,这个比例就上去了。在你能谈的范围内, Claude Code 的使用体验和模型研发之间反馈闭环有多紧密?比如,在推进到 4.0、4.5 这些版本之前,它对模型工作的影响有多大?

Anthropic 的每个人每天都在用 Claude Code 做模型的研究员会用 Claude Code 做产品的人也会用 Claude Code,所以这基本上就是那个循环。你们有没有一些指标可以用数字描述它对公司发展轨迹的影响?从外面看,感觉你们现在发布的产品比以前多很多。合理推测,其中很大一部分原因是你们在公司内部到处都在用 Claude Code。

那我们应该怎么真正理解其中有多少可以归因于 Claude Code?在 AI 实验室工作,你会慢慢习惯用指数增长来思考。基本上所有图表都是指数型的,所以我们几乎所有东西都会用对数线性图,也就是 x 轴是线性的,y 轴是对数线性的,所以一切基本都在指数增长。收入是指数增长,使用量也是指数增长。对工程师来说,这是最有意思的问题。

也谢谢大家一直承受这种增长。基本上所有东西都在往上走,包括代码量。所以我们看 Anthropic 的人写了多少行代码,写了多少 pull request。自从我们发布 Claude Code 之后,这些数字已经增长了好几百个百分点。我记得我们最近分享过的数字大概是三倍,但这个数字其实已经非常过时了。

现在要高得多。等一下,三倍指的是什么?指的是 Anthropic 每位工程师写的代码量。工程团队的规模扩大了很多倍。通常,工程团队变大之后,生产力会下降。我在 Meta 的时候,有一项职责是负责所有代码库的代码质量。我们关心这个是因为它对生产力有帮助,代码质量高,工程师就更高效。我们也用实证方式证明过这一点。

通常会发生的情况是,代码质量变差,生产力下降。还有一件事儿是,工程师人数变多之后,生产力会下降,因为新人会去问工程师这个怎么做,那个怎么做,被问的人就没法写代码了。而且新人上手本来就需要时间。我们在 Anthropic 最先看到的一件事,是新人加入之后上手时间大概只有两天,以前可能要几周,现在是两天,因为你直接问 Claude 就行。

我们现在还得跟新加入团队的人解释这一点。有人会问:“我怎么查询数据库?”答案是打开 Claude,在 Claude Code 代码库里运行,让 Claude 去查数据库,因为里面有一个查询数据库的 skill。他就是知道怎么做。那二零二六年,你们招进来的新工程师里有多少人真正写过代码?这要看你怎么定义写代码,对吧?

这就是问题。等等等等,你怎么定义写代码?对我来说,工程一直是这样。我爷爷在苏联的时候是用打孔卡写代码的。对他来说,编程就是一件纸上的事儿,在纸上打孔,然后把它送进一台大机器里,机器运转一会儿再给你答案,那就是写代码。就像我爸写过很多汇编。他大概会嘲笑我写 Python,说你这根本不算写代码。没错,就像这不是给真正工程师用的,或者说它太高级了。

但编程的本质一直就是这样。抽象层级会不断往上走,它从开关到打孔卡到汇编,再到 COBOL、Fortran,然后是 Java 和那些高级语言,再到 JavaScript、Python 这些更高级的语言。这件事一直在发生,所以我看我们现在做的事也是在这条连续谱上的某个位置。对我来说,一年前我写代码的方式是在 IDE 里写代码,配合某种自动补全。

到了十一月,我把我的 ID 卸载了,因为我已经不用它了。我当时很确定,因为过去一个月我根本没打开过它。所以我就把它卸载了。那时候我可能同时跑着五到十个 Claude,我的写代码方式就是 prompt Claude 让它写代码。现在我觉得又上升到了下一波抽象,我已经不再 prompt Claude 了。

我有一些循环在跑,是这些循环在 prompt Claude,并且自己判断该做什么。我的工作是写这些循环。我觉得这就是接下来几个月,甚至今年剩下的时间里,我们会看到的下一次转变。假设有一个我,当然不是现实中的我。是一名工程师,想加入 Anthropic 的工程团队。你们现在会怎么评估我?对我们团队来说,特别是 Claude Code 的团队,我会很看重的一点是,我们喜欢通才。

大概六个月前,我们开始看到一件事:团队里已经很少有工程师,只是在传统意义上做工程了。传统流程是有一个用户研究员去跟用户聊,然后把内容整理成文档交给设计师,设计师做出 mock,再交给产品经理,产品经理定义范围,然后交给工程师实现。我在 Microsoft 工作过,我对这个流程太熟了,以前就是这样。但我们后来意识到,团队已经不再这么运转了。

我们团队一直比这种流程更偏原型探索,但大概六个月前,我们发现每个工程师都会做范围定义,每个人每天都会跟用户交流,大家也在做设计工程。团队里的每个人都能自己拉数据,做数据科学的工作,搭 dashboard 之类的东西。所以我觉得我们开始看到所有角色都在合并,慢慢融成一种 builder。我记得 Satya 把这种人叫 builder,大概就是这个意思。

对,几乎像产品工程师,但其实你甚至不一定非得是工程师。没错,我们有设计师在发布代码,也有财务的人在发布代码,我们的幕僚长也在发布代码。其实 Acquired 现在所有基础设施也在很快转向 Cloud Code,这也让我想到一个有意思的 Acquired 小故事,我可以讲一下吗?我们是一个音频播客,YouTube,不能只上传音频,你必须上传一个视频文件,那个视频里应该有点内容。

很长一段时间里,那就是一个黑屏MP4文件,所以有一份转录稿当然是个好主意。但我们当时还没有转录稿,因为人工做出来要花一周。幸好现在有AI。后来我写了一整套Claude Code脚本,写得挺粗糙,准确说是我和Claude一起写的。到了某个时候,我就把它丢给David,说你能不能继续把这个东西做下去?一开始有点阻力。

但后来你确实跑起来了,还打开了终端。上大学修计算机课之后,那就是我最后一次打开终端。就在那之后一天,Claude Code 发布了,它的卖点就是,如果你想要 Claude Code 的能力,但不想折腾终端,不想敲命令,不想安装 npm 之类的东西,就可以用它。我们其实听说 David 被迫打开了终端,所以我们就想必须赶紧发布。

我们只有一天时间,所以我想拿这个当引子,请你讲讲 Claude Code 的故事。在我看来,不想打开终端的人,市场要比知道怎么打开终端的人大得多。很有意思的是,先出来的是 Claude Code,然后说实话,过了挺长一段时间, Claude Code Work 才发布。对,确实是这样。说实话,故事差不多就是这么发生的。

我记得四月的时候,我走进办公室, Claude Code。团队几个人坐的地方,旁边有几个数据科学家。我一进去就看到其中一个数据科学家的屏幕上开着 Claude Code,那还是很早的时候,Claude Code 只能在终端里用,还不能在桌面应用里用,也不能在移动应用里用。所以你真的得懂一点才行。我就问。

Brandon说:“兄弟,你在干什么?你是在内部试用吗?就是想弄明白这东西到底是什么,因为他刚加入团队。”结果他说不是我在用它做数据分析,所以他自己搞明白了怎么打开终端,也搞明白了怎么下载 Node.js,因为当时必须这么做。他还搞明白了怎么安装 Claude Code,怎么设置 API key。我记得那时我们可能连订阅都还没有,然后他就真的在用它做分析。

到了下一周,所有数据科学家都开着好几个 Claude Code 窗口在做分析,因为它确实好用。再快进到大概五月或六月吧,Twitter 上有个人,你们看到了吗?他在用 Claude Code 种番茄,他装了一个小摄像头,让他监控他的番茄植株,然后他还在控制植物的营养供给,而且持续了好几个星期。到了某个时候,那颗小番茄开始长出花苞,Claude 就说:“这太让人开心了,我们所有的努力都有回报了。

”我看到那条推文的时候就想:“天哪,时候到了!”我们开始进入主流人群了,一开始要让工程师理解这是什么,花了很久。后来他们终于理解了。现在我们开始看到足够多的非工程师也在使用它。当这种需求和拉力强到这个程度,我觉得就说明是时候做一个产品了。所以我们开始探索,想了很多不同的方案。Claude Codework本身,我们大概用了一周多一点做出来,可能八九天吧。

它百分之百是用 Claude Code 做出来的,它只是很多想法里的一个。但我们一有了,他就觉得就是这个。你们后来砍掉了哪些方向?因为如果让我描述这个创意简报,它大概就是把 Claude Code 的所有能力拿出来,让不想打开终端的人也能用。但这件事没法一对一照搬,你必须在产品上做取舍,选定 Claude Code 能做的某一类工作,把它做进去。

对我们试了很多,说实话,我都不记得所有原型了。我们试过一个好像基于 Slack 的方案,但效果不太好。要把 Slack 聊天机器人做得好用,真的很难。我们也试过基于网页的方案,有很多不同的网页原型,我们也拿不准,但他们都没有让人觉得特别好。在浏览器里用这件事儿本身就有点不顺手,而且如果它在浏览器里就没法访问你所有的工具。

比如我的桌面上有一个 Word 文档,我就没法让浏览器里的东西直接处理它。对访问文件系统这件事儿,感觉是必须的。就是那一点点摩擦,你得把文件拖到浏览器里。就已经足够让体验变差了,我觉得这又回到我们看产品的方式,我们会做自己喜欢的东西,你要做一个让你自己爱上的产品,一个你每天都会用的产品。然后,也许有些用户也会喜欢它。

希望它对其他人也有用。我有个感受挺意外的,因为现在很多 Python 都是在 Claude 的聊天窗口里写出来的,所以我用 Claude Code 的频率下降了不少。我会问他一些需要大量数据分析的问题。然后我能看到他现在在写一些软件来做分析,接着他会写一堆 HTML、CSS 和 JavaScript,再给我渲染出一个全新的 UI,让我在里面操作和探索。

这其实用了很多 Claude Code 式的代码生成能力,虽然我一次都没有直接使用 Claude Code 这个产品。也把这件事完成了。这里有个挺有意思的理论问题:你到底想什么时候做计算?是在从模型采样做推理的时候实时计算,还是先做预计算,让模型写一个程序,然后你可以反复运行这个程序,而且对你来说基本免费?

本质上,我们希望尽可能多做后一种。但真正决定的人是模型。说回这个点,模型本身就是软件,所以它需要一种方式和世界互动,因为它就是以软件的形式存在。它和世界互动的方式就是编程,这就是它天然会说的语言,是它理解的东西。所以从 Claude Code 最早期开始,第一版我就给了它一个 Bash 工具,这样它就能在我的电脑上运行命令。

我没有告诉他任何关于这个工具的说明,他自己就摸索出来该怎么用。有个故事我讲过一千遍了。我问他,我现在在听什么音乐?他打开 Bash 工具写了一个小程序,这个程序又写了一段 Apple Script。我当时心想,我自己都没写过 Apple Script。然后他写了一小段 Apple Script,打开我的音乐播放器说,这就是你正在听的歌。

哪怕在当时,那还是 Sonnet 三点五,那不是一个特别聪明的模型,它当时是最好的模型。但按今天的标准看,已经不算特别聪明了,可他就是知道该怎么做,所以写代码这件事儿,用工具和世界互动这件事儿,对模型来说有某种天然吸引力,这就是模型想做的事。我想先从这些具体产品问题里跳出来,问一点文化和组织设计的问题。

你的头衔是技术员工,我觉得很多人都有这个头衔,这是怎么回事儿?好处是什么?坏处是什么?你会推荐在座这些人也这么做吗?我加入的时候最烦人的一点是,你在 Slack 上给某个人发消息,只看到他的头衔写着“技术员工”。所以你不知道这个人是设计师还是工程师还是经理,也不知道他具体做什么。对,也不知道他做什么。

但我其实很喜欢这一点。我在 Meta 的时候有一点我很喜欢,每个软件工程师的头衔都是软件工程师,没有什么高级软件工程师,也没有首席软件工程师。对,这不是他们的做法。我喜欢这一点,因为如果你给人一些很高级的头衔,有时候他们会提出糟糕的想法,而别人会因为敬重他们就直接跟着走。但其实大家应该反驳,把所有人以这种方式放在同一个起跑线上,实际上是一个很好的文化约束。

但实际情况会不会还是会显出来?比如说,我知道你只是软件工程师,我也只是软件工程师,但我很清楚你其实是某个级别的软件工程师,只是头衔里没写出来。有时候你会知道,但很多时候你不知道。比如我在 Facebook 的时候刚加入时,我是 L4 工程师。我有一个想法,然后我找到了负责连接业务的副总裁,跑去跟他说:“这是我的想法,我们来把它做出来吧。

”他并不知道我是什么级别,这倒挺有意思,而且那是个糟糕的想法,最后也没成。后来我又找了另一个副总裁做了一次也没成,但第三次成了。然后我们组建了一个团队,开始做东西之后,又转去做下一个想法。我现在也经常看到这种情况。我们团队里的人,那些老的资历观念,在很多方面已经不重要了。有些工程师有二十年、三十年经验,但他们反而要忘掉很多东西。

你得花几个月教他们怎么放下那些老习惯,因为那些习惯已经不再相关。反过来,有时候一个应届毕业生加入团队。反而会教我怎么更好的使用 Claude

Code,因为他们会用一种原生的方式思考这件事儿,而这不是我的本能。这件事儿还更难,因为每出一个新模型,你都得重新校准、重新学习。不过,回到技术员工这个头衔,我觉得它其实非常重要,因为工程师、PM、设计师、用户研究员这些旧区分到今年年底就会消失,所以这个头衔帮助我们非常清楚地看到这一点。

并且现在就按这种方式行动,我觉得在AI实验室里,你必须这么做。你要推动每个人更AI-pilied,也更用这种方式去思考未来。我想顺着这个方向问一下,也稍微泛化一点,对在场所有创始人、所有公司来说,他们现在应该为年底的组织状态思考什么?你觉得在接下来几个月里,创始人和公司在心态上必须做出哪些改变?如果是今天,我会做的一件事儿,就是给每个人尽可能多的token。

我这么说当然是因为我在 AI 实验室工作,但我真的会给每个人尽可能多的 token。用 Jensen 的话说,买的越多,省的越多。所以我会从这里开始,给大家尽可能多的 token,让他们去实验。另一件事是,每件事都稍微少给一点资源。如果你在做一个项目,感觉好像需要四个工程师,那就放两个工程师进去,再给他们很多 token,让他们自己想办法做成,大概率他们能做出来。

里面可能有很多东西可以自动化,也有很多流程可以简化,因为他们把这些事情自动化了,下一次就能做得更好。而且下一次成本会更低,这是一个复利效应。除了 token 之外,资源更少反而会带来复利效应。对,这有点像在商业和产品里,你要做很多决策。如果你有一套原则,就会很有用。你可以依靠这些原则,而不是每次都临时拍脑袋。

很多时候,创始人和公司都会有这类原则文档。这件事儿也有点像那样,只是模型也可以使用这些原则,它会以技能的形式出现。当然,如果某个使用场景真的跑起来了,消耗了大量 token,那时候你再进去优化,让它变得更高效。如果我把你的建议复述一遍,大概就是少配一些人,把预算从人力转向 token。这样带来的结果是前期成本会上升,但持续运行成本会下降,因为你已经把很多工作提前做掉了。

这有点像预编译,你前面做了一大堆工作,所以那些一遍又一遍重复的任务后面就会变得简单顺畅。对,这也许是一种理解方式。而且,因为你给这个项目放的人更少,公司里的人就能做更多事儿。在我看来,组建团队这件事最大的清算可能就在这里。大家已经很习惯有一个头衔,有一个专业分工。很多人会为自己是一个优秀的产品经理而感到很自豪,会写一堆博客讲产品这个专业。

你知道这样的人很多,设计师也是一样,他们会很期待展示自己的作品集,展示那些漂亮设计。那我们是不是都需要在十二个月内摆脱这种观念?我是什么,什么专业的人?最后,每个人都只是一个灵活的 token 生成包。哇,Ben,你真乐观。我可能会换一套稍微不一样的说法,但你应该把这句话做成 T 恤。我觉得大概就是这个意思。

对我来说,我做工程师也有一段时间了,但我一直会戴不同的帽子。我以前创过业,也做过商业策,做过产品策,做过用户研究,也做过设计,所以对我个人来说,我就是喜欢做产品。我不在乎自己是不是必须戴着工程师这顶帽子。现在我看到这件事儿正在被验证出来,所以我觉得现在就是通才的黄金时代。那些想做不止一件事的人,从来没有像现在这么好玩,也从来没有像现在这么容易。

也许再问一个问题,我们刚才和 Garrett 稍微聊到过,我很好奇你的看法,你怎么看品味?不管是你个人的品味,还是 Anthropic 的品味。我感觉每次我以为自己写代码的方式有什么特别之处,最后都会发现我错了。我以前对我们写代码的方式有很多看法,比如我真的很喜欢函数式编程,所以我很喜欢 Haskell、Scala 这类有点怪的函数式语言。

一开始我给我们的代码库定过一个规则。代码库里不能有类,只能有函数,因为我自己就是这样写代码的,我喜欢这种方式。结果到了周末,工程师们就开始偷偷提交带有类的改动。我周一发现以后,就会把那个 pull request 拉出来,说不行不行,别这么干。后来某个阶段,模型差不多开始写所有代码了,他也开始写类,我就想好吧,也许模型是对的,也许我这个观点挺蠢的。

只是我个人的一点执念,但这其实不重要,因为业务结果达到了,而且因为这样做结果还更快达到了,代码其实也不差,很明显,代码质量也一直在变好,所以我感觉每次我产生一种。我在某方面很特别的感觉,最后常常会被证明是错的。现在以当前模型能力来看,大家经常说真正的优势是产品品味,我觉得这个也会消失。这确实是今天的优势,但现在我手上有几百个

Claude 在跑,在做各种事,其中很多在看 Twitter 上的反馈,看 GitHub issue,也在看 Slack,然后判断接下来该做什么。

现在大多数想法都不太好,但也许有百分之二十是好的。如果等下一个模型再往后推三个月、六个月,大多数想法可能都会不错。到时候还会出现新的东西,会有别的事情变成我们特别擅长的地方。但我觉得长期看,这些优势都会慢慢被侵蚀掉。你猜最后会剩下什么?有没有某件事是人类独有、特别擅长的?我觉得我们最后要教给模型的是价值观,就像我们教孩子怎样做一个好人一样。

我们也会教模型怎样做一个好模型,太有意思了。那停在这里真是一个很好的结尾。Boas,非常感谢你今天聊得太精彩了,谢谢。