Anthropic为何如此矛盾 | Bloomberg专访 | Dario Amodei | 平滑指数曲线 | 创立根源 | 宪法式AI | SaaS末日 | 国防AI | Mythos

大家好，这里是最佳拍档，我是大飞。今天我们来聊聊Anthropic这家公司，它最近可以说是处在风口浪尖上。之前我们总是会看到，它一边反复警告超级AI可能给人类文明带来风险，一边又用最快的速度建造更强的模型、推进商业化、拿下近万亿美元估值。它身上的矛盾，恰恰体现的是整个AI时代最核心的困境。

最近Bloomberg的《The Circuit》栏目做了一期深度访谈，主角正是Anthropic这家公司。镜头对准了达里奥·阿莫代伊（Dario Amodei）、丹妮拉·阿莫代伊（Daniela Amodei）、鲍里斯·切尔尼（Boris Cherny）还有Claude Code的团队。不过，这并不是一期普通的公司侧写，它把Anthropic放在了一个非常微妙的位置上。

这家公司的能力越强，就越需要外界信任它。但是它自己说得最多的一句话，偏偏是人类不该天真的相信强大的AI系统，也不该轻易相信科技公司。这也正是Anthropic最让人费解的地方，不是它的模型有多强，而是它怎么同时扮演两个看起来完全冲突的角色。

达里奥在视频里用了一个词来形容AI的发展，叫平滑指数曲线（smooth exponential）。它不是我们熟悉的线性增长，而是长期看起来风平浪静，然后在某个节点突然爆发的一种曲线。很长一段时间里你觉得什么都没发生，然后突然之间，一切都失控了。

Anthropic自己的处境也是一样。2021年它还只是一群从OpenAI出走的人创办的挑战者实验室，转眼就成了Bloomberg镜头下的AI巨头。成长速度快到它自己都必须反复对外解释：我们不是一味往前冲，我们清楚自己在触碰什么。

所以今天我们要拆解的核心问题，不是Anthropic到底是不是一家“好公司”，而是它身上的矛盾到底是不是伪善。说得更透彻一点，这期访谈暴露的是AI时代更深层的结构性困境：越是相信AI有危险的人，越会觉得必须亲手把它造出来、控制住它。

甚至把它交到自己认定的“好人”手里。我们先回到Anthropic的起点，也就是从OpenAI离开的那段往事。很多人对这段历史的印象，就是安全派和加速派闹掰了，所以一群人出来创办了Anthropic。但是在视频里，达里奥的说法要尖锐得多。

他承认，当时双方在安全问题上确实有很多合理的分歧，但是这些分歧本身，还不足以让人下定决心离开。真正让合作无法继续的，是信任的崩塌。你开始觉得没法信任对方，觉得对方的价值观和对外宣称的不一致，觉得对方不够诚实。

这句话把Anthropic的创立根源，从技术路线之争推到了治理与人格信任的层面。达里奥在OpenAI提出了scaling laws的核心概念，如今似乎已经是行业共识。但是在当时，这其实是一个反主流、反直觉的科学判断。

后来这条规模化的路线推动了OpenAI的模型迭代，也铺就了ChatGPT诞生的道路。也就是说，Anthropic的创始团队不是不相信scaling laws才出走的。恰恰相反，他们比绝大多数人都更早相信，模型能力会随着规模快速上升。

也正因为如此，他们的恐惧也比别人来得更早。如果模型能力真的沿着平滑指数曲线一路往上走，那么建造者的价值观、诚实度、治理结构和商业动机，就不再是简单的公司文化问题，而是关乎文明级风险的核心变量。

这也能解释为什么达里奥一直强调，Anthropic至今还保留着七位共同创始人。放在普通公司的叙事里，这只是团队稳定的信号。但是放在Anthropic的语境里，这更像一种合法性的自我证明：我们在高速成长的过程里，没有拆散最初的价值核心。

但问题也随之而来。当公司规模成长到近万亿美元的级别，只靠创始团队的完整性，真的还足够吗？这个疑问，我们会一直带到最后。聊完了起源，我们再看看Claude本身的产品设计，这里面同样藏着Anthropic的安全理念。

丹妮拉在视频里用了一个词来形容Claude的目标人格，叫专业的温暖（professional warmth）。他们不想让Claude变成一个单纯的工具，也不想让它变成黏人的虚拟朋友。最终的定位是，可亲但有边界。它不是你最好的朋友，也不是冷冰冰只会照本宣科的计算器。

更像一个有分寸感的专业伙伴。这个看起来只是产品语气的定位，本质上其实是一种治理选择。如果把AI设计成“朋友”的角色，它很容易走向情感依附、陪伴成瘾，最终滑向注意力最大化的老路。但是如果把它设计成纯粹的工具，又会缺少和人类协作所需要的弹性与信任感。

Anthropic选择了一条中间路线，把Claude放在了一个不那么浪漫，但是更稳妥的位置上。支撑这个定位的技术和价值框架，就是宪法式AI（Constitutional AI）。Claude的训练不完全依赖人类逐条标注答案的好坏，而是让模型依照一组明确公开的原则，进行自我训练和约束。

Anthropic会参考《世界人权宣言》这类人类共识性的历史文本，也会和不同宗教的领袖讨论，提炼跨宗教、跨世界观的核心价值，作为宪法的基础。视频里有几个很容易被忽略的细节，达里奥对“好模型”的定义，远不止是不说脏话、不输出危险内容这么简单。

他把标准拆成了好几个维度：不要无意说谎，不要有意欺骗；不要在不知道答案的时候产生幻觉；也不要提供能帮助人做坏事的信息。这不是一个简单的安全开关，而是一排很难校准的旋钮，每一项都需要反复权衡。

丹妮拉回忆起Claude 2早期的状态，有时候过于像个保姆，连用户问天气都会附带一堆过度关心的提醒。这正好能说明安全调校（safety tuning）的难点：尺度太松会有安全风险，尺度太紧又会让模型变得荒谬不堪用。

顺着产品的逻辑往下，是Anthropic的商业选择。达里奥在视频里说了一句很关键的话：如果你的商业模式和价值观从根本上就是冲突的，那公司最后要么背叛自己的价值观，要么就会变得无足轻重。过去一年Anthropic的收入大幅增长，并且首次实现盈利。

主要的增长动力就来自Claude Code、Claude Cowork这类高价值的商业工具。这句话也解释了，为什么Anthropic会把核心赌注押在编程开发、企业服务、生物技术、制药、学术研究、能源这些领域，而不是优先去做好玩、吸睛、能拉长用户停留时间的消费级AI产品。

达里奥明确批评过社交媒体和广告驱动的商业模式，因为这类模式的核心是鼓励用户的参与度，甚至诱导用户成瘾。AI生成的低质内容泛滥，本质上也是同一条激励链条上的产物。只要收入来自用户的注意力时长，产品就会自然而然朝着最大化注意力的方向演化。

但这不代表企业市场就是天然干净的。它只是把问题换成了另一种形式。在企业场景里，AI不再主要争夺你的时间，而是直接改写工作流程、重构岗位的价值、改变公司的成本结构，甚至重新分配整个产业的利润。

Anthropic避开了社交媒体式的心理伤害风险，却走进了更硬核的生产力重构与就业冲击的议题里。这就是Anthropic商业叙事里的第一个悖论：它选了一个更符合自己价值观的市场，但是这个市场一旦成功，带来的影响不会更小，只会更直接。

如果要找一个标志性的节点，证明Anthropic从一家只会谈安全的研究公司，变成一家真正改写市场的AI公司，那一定是Claude Code的发布。鲍里斯·切尔尼在2024年加入Anthropic之前，住在日本的乡村，生活节奏很慢，平时逛农夫市集，自己做味噌。

他第一次使用AI聊天机器人的时候，受到了很大的震撼。一方面看到了技术的力量，另一方面作为科幻爱好者，他也很清楚这项技术可能走向糟糕的方向。后来他回到行业一线，参与打造了Claude Code和Claude Cowork。

在他的描述里，AI编程不是“补全一行代码”的简单升级，而是整个工程流程的彻底翻转。以前是工程师亲手写代码，偶尔按一下补全键；现在是他和一个Claude对话，让它写代码，同时再和另一个Claude对话，让另一个也写。

他甚至提到，任何时候都可以有几个到几千个Claude同时在处理任务。对他个人来说，过去至少六个月里，百分之百的代码都是Claude写的。对他的团队来说，几乎所有的代码也都是Claude完成的。这里最值得我们思考的，不是“AI会写代码”这个结论。

而是鲍里斯的原话：工程工作的定义已经彻底改变了。工程师不再只是把需求翻译成代码的人，而更像是任务的拆解者、代码的审核者、系统的整合者、产品方向的判断者，同时也是多个AI coding agent的指挥者。

业务数据也在支撑这个变化。在开发者大会上，Anthropic提到自家的API调用量年增长接近十七倍，过去十二个月里向开发者和用户推出了八个前沿模型，单季度的年化增长率达到了八十倍。这些不是装饰性的数字，它们指向同一个事实。

Claude Code不是少数工程师的玩具，它正在变成高频使用、快速扩张的工作基础设施。Claude Cowork发布之后，市场层面也出现了很直接的反应。软件股一夜之间蒸发了两千八百五十亿美元的市值，交易员把这个现象叫做SaaS末日（SaaS apocalypse）。

虽然这个说法有点戏剧化，但是市场恐慌的方向很明确。如果AI不只是帮软件公司加快开发速度，而是让客户不再需要某些传统软件，那么整个SaaS产业的估值逻辑都会被重新计算。达里奥的回应不是说所有现有的公司都会消失。

他认为AI会把整个软件产业的蛋糕做大，但是市场的相对份额会发生变化。部分老牌企业可能会收缩，甚至有些企业因为看不到即将到来的变化、找不到自己的护城河，最终会被淘汰。换句话说，AI不是单纯地摧毁软件行业，而是重新分配软件产业的价值。

比产业重构更刺耳的，是就业的话题。视频里提到，有百分之七十的美国人认为AI会消灭工作，接近三分之一的人担心自己的工作会受到影响甚至被取代。达里奥之前就曾经警告过，AI可能在一到五年内消除一半的入门白领职位。

这次被追问这个数字是否还成立的时候，他没有收回判断，只是说自己不知道精确的数字，但是仍然保持同一个量级的担忧。他的逻辑核心，是从百分之九十到百分之百的临界变化。当AI自动化了百分之九十的工作，人类在剩下的百分之十里把能力放大十倍，看起来是生产力的奇迹。

但是当自动化的比例逼近百分之百，问题就变成了：你要给人找到新的事情做。这已经不是“任务会不会被自动化”的问题，而是“整份工作还剩下多少不可替代的经济价值”。达里奥也提到了几个可能的就业方向，比如更多实体世界的制造、建设与维护工作。

更多以人为中心、依赖关系与信任的工作，以及由人类指挥AI、让AI对齐人类意图与价值的岗位。医疗就是他举的例子。AI可能很快就能做诊断、建议检查项目，但身体检查、病床边的沟通、情绪支持，这些还是更依赖人类。

另一方面，Anthropic自己的研究也指出，管理、金融、法律这些领域，近期都可能高度普及AI应用。这就让白领入门岗位的危机不只是局限在工程师群体，而是会扩散到更多的知识工作领域。这不是一个乐观的保证，更像一张正在寻找出口的地图。

更重要的是，达里奥不接受“这只是恐慌式营销”的指责。他在节目里特意反驳说，自己每次谈论就业冲击的时候，都会同时提到税制、宏观政策和新的工作形态。节目旁白也补充，他曾经提出过全民基本收入UBI和对AI公司征收累进税的方案，作为缓冲失业冲击的手段。

这让他的立场更像是“先承认代价，再讨论社会分摊”，而不是单纯用失业焦虑来给自己的产品做广告。聊完商业和就业，我们进入整个视频中最有争议的部分，也就是Anthropic和国防领域的合作。这里的矛盾也最尖锐。

达里奥年轻的时候有反战背景，在加州理工学院就读的时候，他就被认为是相信科学家不该待在象牙塔里的反战倡导者。但是后来他支持Anthropic和美国国防部合作，理由是世界已经变了。俄罗斯全面入侵乌克兰、台海的风险、威权阵营的复兴，这些都让他认为民主国家必须有能力自我防卫。

这套论证的核心，不是“AI不该用于军事”，而是“AI一定会成为国家力量的一部分，所以民主国家不能落后”。达里奥甚至把对中国出口AI芯片的管制，类比成“把核武器卖给朝鲜”，用这个极端的例子来解释自己为什么支持芯片出口管制。

被问到是否信任自己的国家时，他的回答是：我信任，我是一个爱国者。这句话分量很重，它直接把Anthropic的安全叙事，带入了国家忠诚和地缘政治的维度。AI不再只是一个产品，也成了国力的倍增器。

2024年，Anthropic开始和Palantir合作。2025年又和OpenAI、xAI、Google等公司一起，拿到了价值两亿美元的国防部相关合约。同时Anthropic也宣称，不会和移民与海关执法局、海关与边境保护局合作，不认为Claude会被用于加沙地带的行动。

并且给大规模监控（mass surveillance）和自主武器（autonomous weapons）划了明确的红线。但红线不等于没有灰色地带。国防合作的灰色之处在于，很多军事用途并不直接等于自主武器，也不一定是大规模监控，却依然可以提升战争机器的速度、规模和杀伤效率。

这正是AI辅助目标锁定的核心张力。视频里有一组让人感到非常不舒服的数字。节目主持人引用美方官员的说法，大语言模型帮助美军把每天可以处理的目标数量，从一千个提升到了五千个。然后直接追问：这意味着Claude可以帮助军队更快地杀更多人，你能接受吗？

达里奥的回答没有否认军事效率的提升，而是把政策决策权交回了军方。他说，提供技术的公司不能逐案判断哪次军事行动可行、哪次不可行，政策应该交给军事决策者来定。这是很典型的技术供应商立场，但是放在AI目标锁定（AI targeting）的场景里，这个立场就显得非常紧绷。

因为模型不是普通的工具，它会改变决策的速度、信息的排序，甚至人类判断的心理环境。节目也引用了Bloomberg的报道，美军通过Palantir的Maven智能系统，把Claude用于伊朗战争中的AI辅助目标锁定（AI-assisted targeting）。

主持人进一步追问，二月份有一枚美国导弹据称击中了伊朗的一所女子学校，造成一百五十多人死亡，其中大多数是儿童。Claude是否在这次袭击中发挥了作用呢？达里奥回应说，他们不知道模型具体被如何使用，也承认战争中的误判非常可怕。

他的核心防线，是人类拥有最终决策权。他反复强调，最终的决定是人类做出的，不是Claude。这也是Anthropic当初划定红线的核心，他们反对的是模型直接做决策、人类完全不参与的模式。达里奥还用电影《奇爱博士》里的逻辑来解释风险。

如果有一个自动末日装置，检测到核武来袭就自动发射反击，那么误解和自动升级就会把灾难放大无数倍。但这里依然有一个没有被回答的问题：人在回路（human-in-the-loop）就真的足够吗？

如果AI把可处理的目标提高了五倍，把海量信息压缩成几个建议，把决策的节奏推得飞快，人类最后按下确认键，到底是在做审慎的判断，还是在替系统完成责任的闭环呢？Anthropic的红线避开了最坏的情况，却没有办法彻底回答这个灰色地带的问题。

如果说Claude Code代表AI改写了工作，那Mythos就代表AI的能力，已经进入了国家安全的级别。节目里介绍，Anthropic的新模型Mythos可以找出数千个网络安全漏洞，有可能暴露主流操作系统的潜在缺陷。Anthropic自己也暗示，如果把这个模型完全开放，它可能被用来入侵银行系统、窃取国家机密，甚至攻击关键基础设施。

最有张力的评价，来自早期接触过Mythos的公司内部人员。他们的反应是，这是一个超级武器，使用它应该需要持枪证，请不要发布这个模型。这已经不是普通模型发布的讨论语境了，完全是武器管制的语气。Anthropic的应对方案是玻璃翼计划（Project Glasswing），不是全面开放，而是有选择地提供给特定的组织和政府机构。

节目里甚至提到，连美国国家安全局这类联邦机构都想使用Mythos。哪怕Anthropic一度和五角大楼的关系很紧张，达里奥的逻辑是一场猫鼠游戏：好人需要工具来防守，坏人终究也会拿到同类技术，所以好人需要更好的模型，才能提前做好准备。

这个论证听起来很合理，却也最危险，因为它本质上是在为权力的集中做合理化辩护。既然模型太强，不能给所有人，那就必须有人来决定谁是好人、谁有资格接触、边界画在哪里。丹妮拉也承认，这个圈子到底该画在哪里是个非常复杂的问题。

他们也不一定能做得完美。达里奥还提到了对应的商业代价，不发布Mythos对Anthropic的商业伤害很大，因为这个模型已经大幅加快了公司内部的研究、生产流程和下一代模型的开发。如果对外发布，也能帮外部世界实现同样的效率提升。这个代价没有被量化，但是态度很明确：Anthropic想证明自己不是在靠恐慌营销，而是真的愿意牺牲短期的商业收益。

Mythos的出现，也让达里奥更明确地支持发布前的测试与审计（pre-release testing and auditing）。这其实是整场访谈里最重要的一个治理转折。当模型的能力还只是聊天、写作、写代码的时候，安全测试还可以被包装成企业的负责任行为。

但是当模型可能影响银行、国家机密、操作系统和关键基础设施的时候，发布前的审计就不再是企业自律，而是接近国家安全级别的流程了。达里奥对“政府是否应该接管Anthropic”这个问题的回答，也很值得拆解。

他不认为政府应该直接接管，但是也承认这是一个非常严肃的问题，他自己也对此感到担忧。过去的强大技术，大多是由政府建造或者起源于政府项目，比如核武器、互联网、GPS、手机。AI是第一个主要由私人部门先建成、政府很晚才介入的强大技术。

达里奥认为，这是一种危险且不稳定的状态。这个判断把AI治理的问题，从“公司够不够善良”推到了“权力来源是不是错位”的层面。私人公司有速度、有人才、有算力、有商业动机；政府有合法性、有强制力、有公共责任。

但是技术理解往往滞后，两者都有让人担忧的地方。达里奥的说法是，他害怕公司拥有这项技术，也害怕政府拥有这项技术。更麻烦的是政策的摇摆。节目里提到，白宫一开始撤销了前任的AI行政命令，偏向放手不管，让硅谷自行发展。

但Mythos的国家安全含义浮现之后，又出现了管控最强AI、甚至更极端的国有化的声音。达里奥批评这种从极端反监管到极端国有化的钟摆式摇摆，主张走更温和、稳定的中间路线。他的那句话很值得我们记住：“我们不恐慌，我们也不否认。”

这里还有一段内容，能帮我们理解Anthropic的自我认知。达里奥说，他每两周都会在公司内部站出来，花一个小时不限主题地谈自己对行业、对外部世界、对压力的看法，让三千名员工保持统一的认知。

这不是外部监管，但它解释了为什么Anthropic能在国防合作、Mythos、就业冲击这么多争议里，保持一致的对外表述。它把内部沟通当成了治理的基础。在同一段内容里，他还把AI和社交媒体做了更直接的历史对比。

Anthropic认为自己“很幸运是第二个出场的”，因为社交媒体已经示范过了儿童福利、心理健康、选举完整性等等一系列后果。如果AI真的出了大事，被禁止甚至被封锁，都是它应得的结果。

这句话让“负责任”不再只是一句价值宣言，而是承认了一个事实：科技公司不能等伤害已经发生了，才说自己当初只是想做好产品。聊到这里，我们自然会回到最核心的问题：如果连建造者自己都不确定未来，我们为什么要信任Anthropic呢？

谷歌曾经有过“不作恶”的口号，后来在成长中悄悄淡出了。Anthropic也在建造强大的技术，并且会从中获得巨大的利益。那么，人们凭什么相信它呢？达里奥的回答很少见地没有防御姿态。

他说，如果你不了解他，也不了解Anthropic，从不信任开始是理性的。硅谷已经失去了世界很多的信任，必须重新赢回来。而且这不能靠口号，只能靠实际行动。这句话比“请相信我们”要重要得多，因为它承认了信任赤字是真实存在的。

Anthropic的问题从来不是怎么说服大家自己是好人，而是如何在“大家不该轻易相信任何AI巨头”的前提下，依然建立起可检验的外部制衡机制。这也联系到达里奥很喜欢的一本书：《原子弹秘史》。

被问到会不会把自己类比成罗伯特·奥本海默（J. Robert Oppenheimer）的时候，他说自己更认同利奥·齐拉特（Leo Szilard）。齐拉特是最早想到链式反应可能性的人之一，而达里奥认为，我们不能依靠英雄式的核心人物来带领世界穿越风险。

在他看来，奥本海默更像一个失败案例。我们真正需要的，是多个强大主体之间的制衡机制（checks and balances）。访谈的最后，话题落到了文明崩溃的风险上。达里奥承认自己曾经提出过百分之十到百分之二十五这个量级的风险概率。

他也说Anthropic公司里有一半的工作都是在降低风险，但风险不可能降到零。他用航空公司做比喻：你可以做一家比别人安全十倍的航空公司，但你没法保证飞机永远不会坠毁。主持人追问，如果一架飞机有百分之二十五的概率坠毁，你不会登上那架飞机。

达里奥回应说，没错，百分之二十五太高了，所以我们的目标是把它大幅降下来。这个回应虽然没有给人安心的感觉，但是至少足够诚实。最后我们来收个尾，这期访谈表面上是在拍一家AI公司，实际上是在问一个更残酷的问题。

当最理解风险的人，也在加速建造风险本身，我们该如何评判他们呢？Anthropic给出的答案是：选择和价值观冲突更少的商业模式，把Claude设计成有边界的专业伙伴，给军事用途划定红线，对Mythos做有限释放，推动发布前的测试与审计。

并且承认外界从不信任开始是合理的。这些做法，比普通科技公司一句轻飘飘的“我们会负责”要具体得多。但是，这些依然不够。因为Claude Code已经在重写工程工作的定义，Claude Cowork已经让市场重估整个SaaS行业。

AI辅助目标锁定已经进入了战争的决策链条，Mythos已经把模型能力推到了网络超级武器的语境里。当AI变成就业、国防、网络安全和国家权力的共同基础设施，安全就不能只靠公司的品格。

我们真正可以带走的结论是：Anthropic的悖论，不是它一边警告危险一边追求成长。Anthropic的悖论是，AI时代最有权力的安全派，也依然需要被安全地约束。我们需要的从来不是信任某个创始人的良心，而是建立一套哪怕再有良心的人，也不能单方面决定世界走向的制度。

那么，关于Anthropic的矛盾和AI治理的未来，大家有什么看法呢？欢迎在评论区留言。感谢收看，我们下期再见。

Anthropic为何如此矛盾 | Bloomberg专访 | Dario Amodei | 平滑指数曲线 | 创立根源 | 宪法式AI | SaaS末日 | 国防AI | Mythos | AI治理 · 全文文字稿