Hello,大家好,我是小俊,今天给大家带来的是全球大模型季报的第九集。这一集的情绪呢,十分的复杂。一方面,你会看到正在急速进化的AI革命,Coding把AI从聊天机器人Chatbot的第一幕推向了能够干活的Agents第二幕。研究员们已经开始不再亲自写代码了。广密带来的核心判断是,Coding是新的AI加速器,正在加速AGI的实现。
领先的Coding模型就会像领先的GPU。那另一方面,社会层面随之进入了白领通缩与失业的窗口期,整个社会准备好了应对这么急速变化的AI革命了吗?那二零二六年,期待我们和AI共同进步。你相不相信,Code可以表达数字世界的绝大多数任务?因为自然语言是对世界的描述,Code是对solution的描述,就是语言及世界,代码及方案。
如果领先的模型公司不重视Coding,它大概率会掉出第一梯队的。对,我觉得硅谷御三家过去三年,有时候你觉得OpenAI无敌。三四个月前又觉得 Gemini 王者归来,今天是 Anthropic 春风得意,我是感觉每个公司都有自己的窗口吧,各领风骚一百天。今天胜利的秘籍可能就是下个时代的毒药,对吧?OpenAI在ChatGPT过于成功,让他们专注To C,而忽视了Coding。
那今天这里是全球大模型季报的第九集。过去三年呢,我和广密一直在用季报的形式记录着大模型的技术进步和趋势走向。从二零二三年到二零二六年,一直追踪我们的听众会发现,很多季报里的内容都慢慢变成了现实。那最近感受最深的就是我们去年季报里一直在说的 Coding Coding Coding,今年就像海啸一般涌来了,感觉有点猝不及防。
那站在二零二六年第一季度,广密你有哪些突出的感受?能不能先带领我们感受一下本季季报的概览内容?过去一个季度变化实在太快了,那个希望我们季报传递一些最新的。洞察和思考吧,帮大家更好的理解AI,也提前应对好AI海啸的冲击。啊,今天主要聊几个方向嘛,一个是给大家传递一些在硅谷的一些体感和观察;第二部分是分享一些对Coding,呃,这个变化最新的一些理解和认识。
啊,为什么Coding是今天的主线任务?啊,第三也讲一讲硅谷叫核心御三家模型的这个一些观察,尤其是。战略组织和文化,然后也可以讨论讨论未来模型的终极形态会是什么?为什么是操作系统?嗯,后面也可以聊聊一下,就是对社会的潜在影响吧,那个失业啊、通缩和投资这几个方向,嗯。去年我其实还有点担心大模型的技术进步曲线会就此放缓了,会不会二零二六年有点无聊?
但是刚刚过去的第一季度的感受是完全相反的,很多人都会反馈感觉有点跟不上了。那你觉得过去一季度哪些事情是最值得给听众朋友们划重点的?我觉得就一件事儿吧,嗯,过去一个季度最本质、呃最关键的一个转折点就是 Anthropic 的 Opus 4.5 到 4.6 这个模型的跨越吧。我觉得算是一个从 GPT 三到 GPT 四水平的叫跨时代的提升嘛。
嗯,就是让我们从 Chat 问问题。啊,变成了真正的 agent 模式,可以做高价值任务了。因为因为你做的任务的价值量提升了,所以它的。价值就提升,usage也在提升。嗯,我的体感是过去一个季度,模型水平进步的幅度可能超过了二零二五年全年的进步幅度。你包括Anthropic和OpenAI这两家都会有新的模型,呃呃,Mixes跟那个Spar的,呃,马上要发布对吧?
我觉得这两个是真正的GPT五的时刻吧。然后之前还不算是吧。对,之前我感觉 OpenAI 的 GPT 五一直跳票嘛,就是 Open 4.5、4.6 有有这个意思了,我感觉像半代,可能接下来的真的算是真正意义上跨上了 GPT 五吧,因为今天过去就是一个。Model你可以跟他Chat,可以对话,问问题,可以联网搜索,对吧?
那今天是Agentic能力上来了,可以帮我们做复杂任务了,复杂任务的高价值量就上来了吧。嗯,而且我感觉加速度特别快,有可能今年夏天六七月份之前,可能还有一个。GPT三到GPT四的跨越,嗯,就即便说Anthropic、Open新的Mistral和呃Spark很强也好,那可能他们的下一代更强,因为下一代也已经开也也已经开始在在在训练过程,能力了吧?
对,所以所以过去一个季度的推背感非常强。我我是感觉AI的基点时刻应该已经到了,过去一个季度。是的,以前我们还觉得AGI挺遥远的,但是现在身边有些朋友也觉得两年内肯定AGI就实现了。那你对硅谷一线的生态都很熟悉,嗯,有哪些真实的case能够给大家分享一下,让大家能够感受到这种真实的代际的跨越,可以描述的更有体感一点?
对,呃,我我觉得硅谷这边一线的体感可以说一些case,让大家更好的体会到,就是你在这边的朋友,就是前沿实验室的这些AI的researcher们,包括很强的程序员。呃,他们基本上不写代码了。就去年可能一个系统当中可能还有七八成的代码是人写的,今年可能是小于百分之一的。就大家日常的工作可能就是,就就像leader或者教授带着学生呃和team
member去工作一样,就是呃AI来写人来审,可能人来审的这个能力都不够了。
今天Claude和CodeX在很多任务上其实已经到了很多公司的CTO或者首席架构师这个水平了,就就对标一个Meta的L八或L九。呃,其实你看他开发一个feature。可能两三次的迭代就跑通了,对吧?你你我们认识的身边的人,基本上每天都消耗几百美金的token,一周几千美金,这个这个量还是挺夸张的。所以这个就带来一个效果,就是你过去做研发和做研究。
以前一个想法到跑通代码可能两三个星期,现在可能用一两天、两三天,所以所以这是一个大幅的加加速,就是 coding 和 agentic 变成了一个。A G I 加速最关键的一个要素之一了吧?可能仅次于 G P U 本身了。然后,我觉得还有特别有意思的,就是说,也有朋友跟我说,最近很多 A I research 上的突破不是人类工程师带来的。
而是 Codex、Claude 带来的,我觉得这是一个更质变的信号,就是说 AI 今天可以显著的加速 AI,而且带来一些突破了。嗯,你以前解一个很难的数学 MO 的题,可能解个半天,今天 Codex 帮你解可能很快,对吧?就是也不是很多人都很擅长解题或者这个 debug,对吧?你包括他对整个其他领域的研究加速也很大。
你比如说做多模态的朋友说,他们以前做了一个多模态的模型,整个数据迭代可能就一两一两个月吧。那个现在基本上几天或者一个星期,就是Coding加速后,你发现对多模态的研究。加速也很大,嗯,这个让整个数据处理的pipeline其实提效挺快的,呃,主要的变化就是模型处理数据的效率是比人要高的,然后你你包括还有一线的体感就是这个是公开的,就是。
Anthropic,他们过去五十多个工作日发了七十多款产品和 features,对吧?这个在互联网时代好像是根本做不到的。我估计大家可能在网上都要看到过那张图,所以所以 Coding,我觉得是过去一个季度最关键的关键词吧。它会让最顶尖的百分之一甚至千分之一的人,他的生产力放大了。几十倍,我觉得这个是一个很大的变化。
那你觉得 Coding 和 Agentic 带来的变化这么大,有给这几家公司在营收上带来显著的变化吗?我觉得这个是一个更有意思的,就说你看 Anthropic。嗯,他们已经官宣说 A R 超过了 OpenAI,对吧?但更重要的是,它可能头上的一两百万用户贡献的收入超过了 OpenAI
可能五六千万订阅的这些用户,所以之前你觉得 ChatGPT 在 C 端已经赢了,但发现 C 端好像没有 Coding 或者 Agent 这个更大。
所以今天我感觉更有意思的是,不再是只追求DAU或者广告这个规模,而是追求token usage这个指标,尤其是。超级开发者或者塔阶的这个用户,这个感觉更更重要。所以,所以你看,Coding的爆发性,我感觉比ChatGPT当年还要陡峭。就是如如果这个势头下去,年底OpenAI和Anthropic他们的AR有可能就到八百亿美金或者一千亿美金,那明年可能就奔着。
两千多亿美金去了,其实他他两个已经成为了新时代的Magic Seven这种公司了,所所以你看他明年如果盖的一个两千多亿美金的ARR,那其实给个十几倍的PS,好像也非非常make
sense,对吧?所以所以你看历史上。几乎没有出现过两家公司齐头并进,这么短的时间内做到千亿美金营收,对吧?Coding的revenue从过去两三年就超过了Google Cloud,做了可能十七八年的一个一个规模,但那个Google Gemini其实规模也很大,所以你看模型的revenue。
增长是非常陡峭的。哎,听起来 Coding 是智能的一支非常重要的推手,突然让很多不可能的任务都变成了可能,也让嗯产品形态从 Chatbot 走向了 Agent。那我们去年 Q1 的播客就在聊 AGI 的主线任务嘛,你当时就一直在说 Coding、Coding、Coding,啊,包括你去年也跟很多人去说了 Coding、Coding、Coding。
你觉得当时你对于 Coding 的理解已经足够深刻了吗?那今天你对于 Coding 的理解有什么新的变化?啊,我觉得新的变化可能更多是几个强观点或者视视角吧。我觉得第一个观点就是说。你相不相信,code可以表达数字世界的绝大多数任务?因为自然语言是对世界的描述,code是对solution的描述,就是语言及世界,代码及方案,对吧?
因为语言和代码是高度的浓缩抽象,而且覆盖范围非常非常广。如如果这个假设成立,coding
AI智能做好了,是不是就可以把白领知识工作者的大部分任务?都可以自动化了,嗯,就是今天我们在办公室电脑上操作的大部分工作任务,基本上都可以被自动化了。我觉得这是第一个观点吧。我觉得第二个观点是。如果领先的模型公司不重视Coding,它大概率会掉出第一梯队的,而且也不存在只给自己用的Coding
model,因为你自家的任务数据分布是不够全的,肯定是落后的。
而且如果你作为一个领先的模型公司,你过度依赖Anthropic,一旦你做到第一梯队,对它有威胁了。Anthropic大概率是给你断供的,Open被断供了,X也对被断供了,可能Google大部分被断供了,可能算不好哪一天Meta也要被断供了,有可能Coding这个跟GPU是一样的,所以你看Coding它不只是一个行业,也也不只是一个应用场景,也不是一个产品,不只是一个产品,其实它反而变成了AI整个路线图中一个重要的加速器,所以,所以我我觉得它应该是一个。
当下最主线的任务,你没有最领先的Coding model,就像是没有最领先的GPU。你用A一百跟别人用GB,这个差别是很大的,对吧?那还是要追求先进生产力嘛,你不然你研发上就是很落后的。嗯,我觉得第三个观点就是。Coding就很像亚马逊当年卖书一样,你借助卖书把所有的仓储、物流、用户、供应链都拉通了,然后你再横向 scale 其他的 SKU,这样就很容易。
所以,那你就从长期来看,Coding 又只是整个 AGI 实现后可能很小的一部分,因为 AGI 自动化了全球大部分的 GDP。Coding其实更多还是在整个AGI实现中起到一个加速和打样的一个意义吧。我觉得之所以Coding最先跑出来啊,还是因为反馈闭环最短,就是整个所谓的feedback loop最清晰。
嗯,其实其实你看过去几年AI跑的最快的地方,都是feedback loop最清晰的。嗯。我我觉得第四个还有一个比较有意思的观点,就是 Coding 在整个 AGI 的历史进程中到底处在什么位置?因为第一幕我们看到是 Chatbot,对吧?ChatGPT。呃,模型可以对话了,也可以联网搜索了,但其实整个商业价值还是有限的。
啊,第二幕今天走到了 Coding Agent,对吧?Agent 帮我们直接完成任务,本质是能帮我们干活了,进而还可以加速整个 AGI。嗯,或者说 Coding Agent 实现了。有可能,AGI的百分之九十已经实现了。我觉得好像也不用什么范式创新,就可以把大多数的知识工作者的任务自动化了。呃,第三幕可能就是自动化的AI研究员了,这也是OpenAI可能最想做的。
每个人可能都有一个强大的。研究助理,你让研究助理去解决各种各样的问题,呃,那时候可能会去解决基础科学的问题,比如说脑科学、神经科学、材料学,对吧?所以,所以我们画一个AGI的路线图,就像爬一座科学的高山。但每个 AI lab 可能有自己的路线图啊。那今天我们处在什么样的位置?Coding 又处在什么样的位置?
有可能今天还只是整个科学的高山攀登的开始吧。对你说的这个,我也觉得很感慨,因为去年其实你说 Coding、 Coding、 Coding 的时候,很多人可能会觉得 Coding 还只是一个垂直场景的事情,他没有意识到 Coding 能带来这么强的泛化性。我觉得就一个精辟的总结叫“语言级世界,代码级方案”,因为只有这两个它的泛化性是充分被证明了的,其他领域的泛化性还没有被充充分证明。
你比如说,我想通过数学来。提升智能能力可能可以,但是数学能表达的东西太有限了。很明显,我们今天是从第一幕走到了第二幕,那从拆爆进入了 Coding Agent 时代。那据你观察,现在所有人已经充分的意识到 Coding 非常重要了吗?那既然重要,为什么有些人没有 All In 资源去做呢?我知道的好几个AI lab好像都把Coding放到了最高最高优先级,嗯,但基本上也是过去一到三个月的事情。
嗯,你发现实际做好好像也没有那么容易,所以我觉得大家心里可以打个分儿,就是做好Coding的难度系数一到十分,你到底打几分?呃,如果低于四分呢,那大家每家都能做好,非常卷,对吧?如果高于八分九分呢,那有可能领先的Anthropic可能会一家独大,大概率会继续领先。其实你也没有其他什么理由能能继续超过它,嗯。
我觉得取决于难度系数和竞争吧。那你觉得做好 coding 的难点到底在哪里啊?就是大家既然都知道 coding 很重要了,能不能给大家讲讲?就是如果要做好 coding,应该最重视的、最头部的三件事情是什么?我觉得最重要的可能就两件事,一个是组织和文化,第二个是数据。就是其实我觉得 Coding 不只是一个技术 know how 的问题了,更多还是一个战略和组织的问题。
嗯,我我认识的研究员朋友好像都跟我说, Coding 最重要的是数据这个壁垒。但但问题是,你觉得哪一个 AI lab 能组织好最聪明的?非常有想法的几百个人就 all in 搞 coding 一个事儿,因为这里面有很多脏活、很多苦活,就是搞数据的活。因为每个 lab 里头最聪明的人都想做自己的一些 bet,搞自己的实验,对吧?
搞一些新的突破,零到一都想成为一粒啊。嗯,我觉得这个可能是一个问题的根本。那 Anthropic 可能不一样的点就是说,他们的这几个 founder 可能一开始就意识到数据可能是。所有问题的根本叫模型级应用、数据级模型,对吧?所以我感觉他们重视数据可能是刻在骨子里的。嗯,有个 rumor 就说他们的首席科学家 Jared Kaplan 就亲自带着团队过数据,这个好像是比较少见的。
我我觉得更重要的还是说。不做什么,对吧?你看 Anthropic 就完全放弃了多模态,对吧?可能多模态不在科技树的主线上,啊,也没有跟风做 reasoning model,那 To C 也也放弃了,对吧?然后就是在 coding 比较专注,嗯。呃,这是第一个,我感觉组织上,嗯,和不做什么。第二个可能是数据吧。
第二个就是说,数据这个点可能更难一些。以以前 Chatbot 就是 Chat 那些文本类的数据,那今天呢,可能更复杂了。就 Coding 和 Agentic 它是一套的,它既有任务,又有环境,又有整个的评估,所以这个数据。比以前的数据难了很多,而且你要造出来很多数据,所以 Coding 做好可能没有想象的那么简单。
我觉得更重要的还是说,每个公司在战略、组织、文化上,其实并没有真的重视起来。嗯,其实你看过去半年,Google 和 OpenAI 是过去在争 To C 的,其实对 Coding 也有很大的战略误判的,其实是严重低估了 Coding 的重要性和优先级的。除了 Anthropic,在嗯,当然现在一到三个月内,很多人都已经开始把它当做最重要的优先级了。
那在之前呢,其他团队为什么没有专注的去做 Coding?他们没有意识到 Coding 这么重要吗?我觉得每家都有自己的战略优先级的选择,包括过去的一些思维上的包袱。因为你看,现在有两条AGI的路线,第一条是追求C端的流量,ChatGPT、Gemini、豆包,对吧?第二条是追求高价值的任务,Anthropic这比较领先。
那就看你想要哪个,对吧?Anthropic也许是被迫只能选Coding了,因为C端窗口它错过了。嗯,其实你说C端重要吗?有可能也重要,就是有可能C端未来也是会覆盖掉高价值任务的。其实你看,二五年其实是C端窗口很关键的一年,其实很多模型公司都已经错过了C端的窗口了。呃,ChatGPT和Google忙着抢C端的这个窗口,才错过了Coding这个窗口,对吧?
我觉得可能战略。你选择什么可能更重要,就是这个可能是每个模型公司管理层最高思考的问题。你今天资源很有限,你到底是搞C端?还是搞 coding,对吧?因为资源精力是有限的,然后可能是要放弃一些东西的。我觉得更多是战略选择,你到底优化一个什么样的目标,到底要什么,这个可能是更关键的。那你觉得这第一条路和第二条路,一个是 C 端窗口,一个是高价值任务,他们未来会 merge 吗?
他们会融合吗?他们会成为统一的一件事情吗?现在看还是两条路径。我觉得融合的概率是非常大的。嗯,包括 Chat GPT 后面把 Chat 跟 Agent Code 这些东西都融合起来,All in One 一个平台本身是对的,但是有可能存在另外一种情况,就是说,有的人只做塔尖的用户,塔尖的用户就像量化一样,就是只有极少数的人,可能一两百万人贡献了很大的 usage,这是有可能的。
我也不知道未来C端的这个DAU还有没有意义,有可能有意义,但有可能那个塔尖用户的token usage可能更有意义,因为它也是数据的一种,它其实补充了预训练的数据。嗯,数据的飞轮,我觉得还不知道,因为我也不知道大多数人在未来这个时代中的重要性还有没有以前那么强,有可能塔尖的人会贡献整个世界的生产力更加集中。
我我感觉强者恒强是很残酷的,但这又是一个趋势。嗯,这是会带来整个社会的整个分工的变化,这个我们后面也会聊到。那接下来能不能分别展开聊一聊,就是据你观察,这每一家的模型公司它的战略组织和文化特点,能不能分别跟我们讲一讲?第一个应该是 Anthropic 吧,因为你对 Anthropic 相对是熟悉的。
嗯,你觉得他们是最早看到了什么迹象就 bet 的 coding 这个事情呢?是怎么做的这个关键的技术决策,关键的推动者是谁呀?嗯,All in Coding其实也不是他们Day One就能想清楚的。我觉得一方面是C端没有机会了,第二是二四年夏天我记得发了Soul Net三点五,其实那个给了Coding的正反馈,其实也是在摸索的过程中把Coding这条路线给摸清楚了。
嗯,但这个公司更值得关注的是它的几个特点,就是在那之后,二四年夏天在那之后。只凹印了一件事儿,就是 coding,今天做成了,而且巨大,对吧?而且他们放弃了 C 端,放弃了多模态。战略上是非常 top down 的,Open 是特别 bottom up 的,所以 Anthropic 有一个非常 align 一致的目标,就是搞好这个东西,有一个自己的一个路线图,对吧?
而且创始人特别汉藏,懂技术,带着大家搞数据、搞工程,对吧?呃,重视数据可能是写在基因里、刻在骨子里的,而且 Anthropic 这个团队好像也一直比较稳定,不像 Open 团队。没那么稳定,人才流失之类的,以及你跟Anthropic的人交流,我感觉他们每个人都很相信AGI,就特别AGI原生的那种这个状态吧。
可能这个创始人也特别有洗脑能力吧,经常会传递一些比较像宗教一样的。这个发言,嗯,其实你看Anthropic过去说的,包括融资讲的,好像全都实现了。我我觉得这可能是一个优秀公司应该有的样子吧,就是弄清楚战略之后就。坚定的执行,组织和文化也都跟进,对吧?就是我觉得坚定最重要,就不要摇摆。那个,其实你看他们很早就不做多模态了,呃,或者投入非常小,可能这就不是他们所认为的科技树的主线。
很多人去年说预训练撞墙了,他们好像没也没觉得撞墙,依然坚持做,也是他们擅长的。很多人觉得 L 这个事儿。封神的时候,他们也没有把L这个封神,也没有去做所谓的reasoning model,嗯,好像他们没有刻意神话一个人或者某一块儿,最终目的好像就是做好一个模型,也没有觉得非得就一个环节重要,更像是一个集体、一个球队、一个工业化的体系,每一个环节都做好。
就是相比之下,Open可能有些做的不好的地方,其实可能比较像VC对吧?喜欢造新的概念。把某些概念可能推得很高,或者容易神化某一个环节,就是以前神化pre train后面post train对吧?后面这个o one o three对吧?嗯,但好像Anthropic就不太会就这个动荡摇摆很大。嗯,我我觉得这可能是。
嗯,文化特点可能比较重要的。其实你看组织上呢,Anthropic可能是一帮人就做一件事儿。Open,你跟他们小伙伴交流一下,经常是一个人做一个新的事儿。这个,所以专注度聚焦,我觉得可能是一个比较关键的,而且。Anthropic好像一直是不怎么招那些 big name,都是招
underdog,嗯,而且对文化面试也比较严,经常会问你很多文化问题,比如说 AGI 实现了之后,种种种种各种选择,你会怎么做?
我的感觉好像 Anthropic 早期的人都还是比较。AGI mission驱动的,就是你看,Offer当时比OpenAI低,风险也大,很多人还是进来了,可能也是一个筛选吧。然后这些人都还是比较AGI原生的,所以他们的文化也一直比较稳定,人才流失也比较少。你说到Anthropic,我想到,我觉得他们除了模型,他们在产品上做的也挺有sense的。
他们的产品有什么方法论吗?就是感觉他的产品非常的AI native,非常懂产品。对,我我是感觉他们的产品文化和产品sense都是蛮好的。其实随着模型能力的提升,他们好像是把模型能力转化的产品转化到用户体验,这个效率是更高的。因为他们做产品的很多人还是工程师或者研究员,很懂模型能力。你比如说那个
Coding 的创始人 Boris,Boris 其实是很强的 coder,他其实是想 deliver 一个最强的。
Coding的工作方式在引领整个开发范式。其实你看Cursor火了以后,很多人在讨论说,模型公司要不要再做一个IDE?哎,好像Anthropic没有做IDE,而是它做了一个终端的形式,就是今天的Cloud Code,因为这个可能是更能承接住。模型的红利的,因因为模型是指数级增长的,但你产品也得指数级接住这个能东西。
我我是感觉他们的产品Sense还是挺在线的,就是。嗯,产品比较面向AGI,面向模型指数增长的这个红利上,我我觉得他们用户体验也确实不错,然后产品的harness这些东西做的也比较好。对,嗯,你刚才也提到了Anthropic的组织和文化,它的founding team是什么样的呀?能不能评价一下他们的呃核心团队,以及这些做产品也都是来自模型team对吧?
啊对,呃,其实你看他们其中两个 founder,一个是 CEO Dario,还有一个首席科学家 Jerry Kaplan,他们俩是物理学家出身。其实他们对 AI 的理解更多是从一个物理观察的角度出发的。他也没想着创造新的什么 transformer 架构,但就是会把 transformer 这个架构 scale 的比较好。
其实是像物理学家一样洞察了这个AI的规律,找到了data efficiency架构的efficiency工程的efficiency,对吧?好像也没有像Open一样有执念,非得做下一个范式,就是踏踏实实执行的比较好。好像也没有说绝对的各种secret,别人不知道的。呃,但是好像就是把工程、把细节做得比较好。
产品团队其实很多还是工程师和。呃,researcher,呃,其实是比较像早年硅谷的文化的。你说他们嗯没什么secret,但他们其实是防泄密,然后做信息保护做最严的一家硅谷模型公司,对不?我觉得是他们的文化吧,就是内部很透明,然后防止信息外泄,可能一旦出现信息泄露,可能就开除啊,或者很严格的那个,大家也都比较尊重这个事儿吧。
所以你看,大家对Anthropic的了解还是比较少的。哎,那你觉得,嗯,因为 Anthropic 它其实有一两年的时间窗口,因为直到去年都只有一部分人看懂了 Coding,那今年似乎所有人都开始 All In 了。你觉得它在 Coding 上的护城河高吗?有多高呢?以及现在市场对于 Anthropic 是不是高估了?
因为他们产品线或者 revenue 是高度集中在 coding 或者 agent tech 的,可能 maybe 百分之七八十的 revenue 都来自于这块儿。我觉得就看这件事儿的难度系数吧。未来竞争肯定还是非常激烈的,嗯,但我感觉也主要是头上的三四家吧。Anthropic还是有危机感的吧?如果就是现有方式不动,就是往前scale,可能他们还是有信心保持一定的优势的。
但技术变化总总是很快的,这个大家又很担心Open又搞出一个惊天动地的新的东西。我我自己的判断是,OpenAI和Google最终都是能追上来的。啊,如果你说风险的话,我觉得算力可能是一个之前。包括他们自己内部可能也没有预估过去一个季度需求的爆发吧,所以算力规划也保守了。我我感觉今年实现一千亿美金的ARR,最大的 bottleneck 可能就是算力。
呃,我估计可能后面要到处扫货各种GPU吧,然后。Anthropic我觉得有一个比较有意思的是,它定位的是高价格带的那个用户群,它的定价是很高的,一直也没有降价。其实Open以前是不敢把模型做的很大的,因为它的用户量太大了,很多人不付费。但是呢,你要是去定位一个高价格带的用户呢,那我就scale很大的模型,有最好的效果,我就最高的定价,也有好的margin。
所以它是做了一个塔尖的金字塔塔尖的一个市场,所以就看它未来能不能守得住这个市场了。这个很有趣,嗯,不对。所以总结来讲,我觉得 Anthropic 更像是战略的一个胜利,或者产品专注的胜利,或者文化呀,嗯,我觉得这几个隐形要素是比较重要的。我觉得不可不然,他们不可能从落后的一个位置杀出来的,不然早就挂掉了。
你讲到 Anthropic,它做的是塔尖用户,那 OpenAI 现在也开始重注 Coding,它现在没有办法掉头了呀,因为它已经成为一个大 DU 的产品,那它应该怎么做它的战略和定位呢?我我get到的sense就是OpenAI也要把Coding放到最高优先级。其实GPT 5.4的Coding能力最近社区反馈是非常好的,呃,甚至不弱,但Agentic能力还是弱一些,嗯。
我的感觉是它的 coding 能力已经上来了,其实 agent 那个能力上来有可能也是时间问题吧,所以最后就看那个塔尖的市场是不是能守得住吧,我觉得不好说。如果它做的很强的话,那你还能不能只做那个高端市场?我是感觉 Open 的人才密度、资源、能力其实也是不差的,只是过去战略不太聚焦,或者没有意识到 Coding 如此重要。
嗯,Coding 在商业化上现在除了 Coding 还有其他的吗?我觉得就是把 Agent 这个做做好吧,也把 Agent 的产品一方的 Agent 的产品做好。其实最终的目的就是用 Agent 用 AI 去 automate 整个 Global GDP,对吧?那那如果从 Long Term 来看,我觉得。
OpenAI也好,Anthropic也好,Google也好,最终最终都是奔向一个事儿,叫有一个自动化的AI researcher或者AI scientist帮你去做很多基础科研的一个研究探索。因为我们知道OpenAI有上市计划吗?Anthropic今年有上市计划吗?有可能十月份、十一月份吧,我估计年底是不是都会上市?
他们都上市了,会对于这些公司人来说会有什么影响吗?你你说那个那个那个那个内部员工吗?还是什么?内部员工就都有钱了。我觉得。researcher朋友们都是很担心自己的工作的。我过去一个季度最大感受是,最牛逼的AI
researcher都担心自己一到两年后没有工作了,可能自己未来一到两年可能是仅有的一个工作的窗口吧,因为后面AI可以automate整个AI research了,自动化的研究的workflow有可能是。
未来一两年是最关键的,他们工作和赚一些钱的窗口了吧?这么悲观吗?那以上是硅谷御三家的第一家 on topic,接下来我们来聊聊我们这个最熟悉的 OpenAI 吧。嗯,对 OpenAI,我觉得上一期播客其实聊了很多好的地方,对吧?C 端遥遥领先,对吧?九个多亿的周活,但最近比较 flat,没怎么涨。呃,五六千万的付费用户,过去历得过两次范式创新,下一次大概大概率也是 OpenAI 能力的。
它的新的模型SPAR应该很快发了吧?大概率也是很强的,还是一个代际上的一个一个提升。反正综合的实力和人才密度都还是挺强的,也比较重视research。research其实在在内部也比较像一等公民吧。但现在问题是什么呢?ChatGPT C端看着赢了,但发现 Coding 比 Chatbot 要大很多,可能大十倍到一百倍,所以这是一个最大问题。
对,嗯,哎,我想问问,OpenAI 是什么时候意识到 Coding 很重要,开始加码的?我猜也就两三个月之前嘛,之因为之前还忙着跟Google Gemini去抢C端的流量呢,呃,去抢DAU去做增长,呃,其实你看Meta来了那个FG做商业化,对吧?我感觉它还是像互联网的老人。其实你发现那个并不重要,嗯。
其实是对 Coding 有严重的战略误判的,包括 Google 我感觉也被带沟里了。其实大家对 Coding 都有战略误判,其实不应该再用互联网思维、用 DAU 这些思维再去看这些东西了。我看 Fiji 已经被被调了,我估计可能是不是背锅去了。哦,哎,这个战略决定跟嗯最近 Sora 被关掉会有关系吗?
因为我觉得他可能意识到了 Coding 才是主线,多模态不是,那应该更加的战略聚焦。我觉得肯定有关系吧,因为G P U太有限了嘛。其实多模态还是挺耗卡的。其实你说Sora发出来之后,那么多人,即便你模型做好了,那么多人去创作,这个对Open有什么好处呢?好像也没什么好处。所以在A I时代,D A U不重要。
不知道,我觉得这个是开放答案。嗯,有可能重要,有可能只有塔尖的token usage更重要,因为绝大多数人的智力没有模型高了。那我不知道人类在整个社会中的价值是不是发生了变化?那人类价值发生了变化,谁给AI买单呢?那塔尖的用户创造了更多东西,你比如说脑科学材料、新的药物治疗人类所有疾病,好像又会有生产力的提升嘛?
那通过税收来调整嘛?进入进入福利社会,嗯,但是这个对美国肯定是挑战很大的,因为美国是一个中产社会,嗯,一个多亿的中产,对吧?程序员、律师、医生、中介啊,banker,其实我是感觉可能很多人在未来一两年就是没有工作了。这个肯定会带来社会的贫富差距拉大,矛盾的激化。嗯,你说Sam最近有两次被袭击,我感觉有可能未来这种事情会越来越多,肯定会有这种情况。
你有没有觉得有一个现象是在美国对于AI的情绪更悲观,在中国更乐观?我觉得在硅谷的话是很乐观的吧,嗯,但有可能这里面重要的一个点是技术变化太快,进步太快,每个人都没有安全感,每个公司都没有安全感,嗯,甚至说大家都担心自己未来一两年、两三年以后工作都没了,所以有点那种末日论的感觉。但是我是感觉AI终究会带来繁荣,但是这里面可能会有一个痛苦的窗口,因为人类没做好准备。
AI过去一个季度的智商的进步,可能比人类过去两百年智商的进步要快。那我们没做好准备,怎么驾驭好这个?因为很多的工作还是过去的范式,嗯,所以这个错位可有可能是比较痛苦的。嗯,刚才我们说了,呃,Anthropic和OpenAI。那你觉得目前Code Code和Codex它的市占率分别是多少?我看Sam在Twitter上宣布了,Codex有个三百万的活跃用户,应该是周活跃对吧?
那Code Code,我猜可能一千五到两千万,我估计可能是一个。七比三的关系,猜测,我没有准确数字,我只是猜测。嗯,你看,意识到 coding 非常重要的还有一家公司,Cursor,但是我们到现在都没有提起来。呃,模型公司现在都把 Coding 当做主线去卷。那像 Cursor 这样的应用公司,虽然他们也自己开始训练模型了,那你觉得这个公司后面怎么办啊?
你看好吗?嗯,如果最强的模型公司不把 Mistral 跟 Spar 的这个最强模型 API 开放出来,而是优先通过产品、通过 Agent 或者 Co Work 的方式提供出来。优先弄好自己的产品和生态。那科斯用不了最强的模型,那怎么办呢?就因因为科斯的本质还是吃到了模型公司技术溢出的红利。那如果模型公司选择不溢出了?
呃,那好像也合理,就像自己接住嘛。除非有,除非有一种情况是开源的模型或者自己吹的模型也跟 frontier 差不多了,但今天肯定还是有一个 gap,所以我感觉 cursor。最好的是卖给微软,做开发者可能还是比较好的吧。或者卖给马斯克,嗯,对,所以 Cursor、Minus、Open Cloud 它的本质可能是一样的,都是吃的模型公司技术溢出的红利,但是它是阶段性的。
大家都有窗口,有的人可以借助窗口变成一个伟大公司,但有的窗口终归是阶段性窗口吧?就是壳公司好像还是阶段性的窗口,对吧?呃,不一定,有的壳可能是有价值的。如果未来有新的交互了,用户的 context 都在了,我觉得是存在窗口的机遇的。只是说模型公司作为大哥,他也想吃掉这块肉,就看谁的速度快了。嗯。今天问题是模型公司的速度好像比创业公司速度更快。
他自闭环了吗?对。那说回 Open I,你对 Open I 的前景现在是觉得更乐观还是更悲观啊?如果这几家模型公司都交替着往前走,未来比拼的关键是什么呢?我对全球领先的三四家甚至三五家模型都很乐观。嗯,我觉得未来这些模型公司都非常重要。嗯,现在市场对Open的叙事是比较悲观的,我是没有那么悲观的。我觉得有百分之五十的概率,整个AGI最终的winner。
可能还是OpenAI,嗯,因为在这个时代,今天胜利的秘籍可能就是下个时代的毒药,对吧?OpenAI在ChatGPT过于成功,让他们专注to C,而忽视了Coding,呃,因为要重视那个inference的成本,所以模型一直没有做很大。那今天Anthropic的成功呢,更多还是渐进式积累的,把细节做好,我觉得更多是执行的胜利,专注或者是组织的一个胜利。
但有可能并不一定能抵御住Open下一个范式级的突破,因为Open它有一种文化是自下而上的,就放开你去自由的探索。因为今天Coding能力很强了,可能一两个人就能干出来一件惊天动地的大事儿。有可能未来决定胜局的,可能就是一两个人,也有可能就是Open的这种文化下是有可能。搞出惊天动地的新范式的,所以今天你看着有的优势都不见得是优势了。
我觉得未来今年一年年内格局是定不下来的。过去三年格局都没稳定过,只是持续的淘汰赛。今天又是巡回赛,可能还得打一年。嗯。就是以前所谓的壁垒是防冷兵器的,对吧?但今天是各种现代化武器模型又开始自我迭代,我是感觉以前讨论那些壁垒,不知道规模效应、数据飞轮、网络效应可能都不知道,有可能未来有一些未来的这些东西吧。
你觉得 OpenAI 有什么做的不好的地方吗?你刚才也说到,你批批评一下它。啊,我觉得还是有不少做的不好的地方的。嗯,我觉得这个可能也是值得借鉴或引以为戒的吧。我觉得最大的可能就不够聚焦吧,因为Sam他还是一个VC出身,容易贪大饼,对吧?就什么都想要,就也比较容易formal。嗯,其实他文化也是自下而上的,反正自下而上这个呢,分硬币的两面,有好有坏。
嗯,你比如说多模态,比如Sora,其实以前是应该是一个支线,但团队都在努力的推,说很重要,对吧?去找Sam要卡,那Sam还是会allocate很多资源给到Sora团队。嗯,其实就很像V C去allocate capital嘛。嗯,其实没啥拒绝,有可能这是Sam他不是技术出身的原因吧?可能团队要那就给了,想做的项目可能也很多。
嗯,另外一个点,我感觉他们文化上是特别value这种零到一的突破,但是没有那么value一到一百的突破。那这种文化引导下呢,就会导致很多人 ego 很强,就没有人做脏活累活苦活,所有人都想去做突破性的工作,所以就没有人踏踏实实的搞数据清理、数据做好产品运营,对吧?包括你看 ChatGPT 这个产品很成功,但是感觉又没有灵魂,你都不知道 ChatGPT 这个产品经理是谁,是 Sam 还是还是谁?
对,所以,我我是感觉没有灵魂,嗯,对它更多是一个技术模型很牛逼,比如说 ChatGPT 很成功。规模这么大,但是总感觉产品没做好。那你交给字节这种文化下做 ChatGPT 这种产品,我感觉肯定是做得更成功的。说回来,OpenAI 可能最大的战略误判还是整个预训练和 Coding 这两个没做好吧?这两个还是最根本的,因为之前。
他是有很强的领先优势的,可能领先一年两年。呃,因为Sam不是技术出身,可能对技术路线或者做哪些技术决策,可能还是不如俺Sophie这种技术出身的人。更果断吧。其实你刚才说 ChatGPT 没有灵魂,我在想会不会今天的产品其实不需要人赋予它灵魂呢?因为本质是 AI 强,就是你你要一个产品经理去赋予它的灵魂,maybe 是一种 ego。
我觉得有可能最后只拼 GPU 了,因为最后大家都能迈过那个基点,可能全球三五家五六家都能迈过 AI 的基点,有可能就是拼 GPU 了。因为AI自己成长的比人快,已经自动化了AI的research整个process,有可能研究员插不上手了。刚才我问你,今天的Anthropic被高估了吗?那么今天的OpenAI被低估了吗?
我觉得阶段性被低估了吧,因为最本质的还是模型的进步,OpenAI这个文化这个组织,我觉得还是能继续推出来。Soulton Model,我判断 OpenAI 的 Coding 和 Agentic 能力大概率还是能追上
Anthropic,呃,因为最近战略大转向,我觉得也是个好事吧。然后我觉得更多是两个公司的文化,OpenAI 一直想做爱因斯坦,Anthropic 就是把整个白领工作给 automate,就是 OpenAI 想跨过 Coding,以前没那么重视
Coding,想直接去做爱因斯坦,但是你发现这条路很难,而且没那么实用。
因为,Anthropic做的很实用,实战特别好,所以Revenue爆发也快,有可能让他们获取更多的资源,加速整个AGI,有可能是一个特别务实的路线。啊,但OpenAI呢,今天也意识到这条路线很重要,所以也调转枪头,也要把这条做好吧。所以我的判断是,OpenAI也不会掉队。可能跟Anthropic可能还是齐头并进,嗯,Google肯定也能上来,呃,所以取决于Coding的难度系数吧。
所以我是感觉今年的格局肯定还是定不下来,还是你追我赶交替领先这样,嗯。OpenAI马上就要发新模型了,对于这个即将要发布的模型,你有哪些观察和预测吗?我觉得是真正意义上的GPT五吧。之前GPT五跳票太多了,嗯,之前的五点一、五点二、五点到五点四,可能更多还是GPT四level的model吧。我我觉得SPARK的有可能是真正意义上的GPT五代际上的提升嘛,这是一个预期吧。
第二个有可能他们在呃,Sway就是软件开发、软件工程有可能还是没有Anthropic强,但是其他地方可能都会大幅的提升,因为Anthropic在Coding在软件工程是优化特别多的啊。但是长期来看,Agent的能力我觉得都是能上来的。嗯,第三就是我感觉Chat和Code那个All in One的产品可能是对的策略吧,但Spark的更多是一个新的平台嘛,嗯。
未来可能每个月都有新的model出来,在这个平台上持续迭代,有可能会迭代很久。我觉得最后可能还是比拼算力了。Open的算力可能比Anthropic要多很多,那取决于后面的迭代速度了。那接下来我们来聊聊硅谷御三家的最后一家,嗯,巨头 Google 的 Gemini。对我感觉 Gemini 三点零当时是被高估了,其实 Benchmarks 刷的很高,其实你看 C 端其实没有持续增长,用户也不太买单。
嗯, Gemini 看起来很好,但实际体验用起来也没那么好。嗯,我感觉 Benchmark 有点过度优化了。嗯。产品能力不行,其实你看 Gemini 三连 PC 的桌面版今天都还没有,然后他们更多还是一个工程师或者技术驱动的文化吧。其实 PM 这个文化好像也没有那么强,或者没那么强势吧。其实你看 Gemini 三当时热度很高,感觉像。
Google王者归来,除了让Google的股价翻倍了,呃,证明不是AI的loser了,其他好像也没捞到太多好处吧。那个三点一好像也没有真的大的突破。我觉得反而让他们沉浸于Gemini三的成功喜悦之下,严重误判了Coding的重要性,这个可能还是一个失误吧。然后,但我听说最近Coding也伤到了公司最高优先级,但其实已经晚了三四个月了,才意识到Coding的重要性。
啊,其实有时候火一个模型,其实没啥,还是要持续的、底力味儿牛逼的模型可能更重要吧。啊,其实Gemini之前战略上更重视C端和多模态,其实是忽视了Coding的,因为二五二六年可能是C端格局最关键的两年窗口,因为你错过了C端,有可能未来也扳不回来了。那个,所以就忙着跟ChatGPT争C端,这个反而给了Anthropic在Coding一个非常好的黄金窗口啊,Anthropic过去也抓住了。
但是其实有可能,这个时候Google应该降低在多模态的投入,啊,优先把Coding这个补回来了。如果你Coding落后三个月,以后可能就落后一年,因为它会放大。我觉得主要还是组织问题吧。Google的组织文化可能也跟Open这两个更像,就是说它是一个自下而上的文化。啊,每个人可能都有自己想做的,有重要的人、Senior的人站住位置,有些东西可能也不不容易被加上去。
嗯,然后反正我感觉Gemini的。印度人比例越来越多了,我我也不知道这是一个好的信号还是一个坏的信号。反正我觉得长期来讲,Google还是叫最领先的追随者,呃,资源和布局上没啥短板,战略上只要跟随。Anthropic和OpenAI好像就还可以,我觉得掉队的可能性是很低的,呃,但短期好像还是需要调整的。
短期我觉得可能也拿不出太多牛逼的东西,但拉长看总是能追上去的。嗯,我觉得拉长看,Google可能是最稳的,因为算力是最足的,现金流是最足的。其实Google的worst case就是。TPU都可以变成另外一个英伟达,对吧?然后,反反正虽然他们有 politics 各种组织移动缓慢各种问题,但是你看这个这个公司已经到第三代职业经理人了,这个挺厉害的。
其实很少有科技公司能到第三代职业经理人,而且运行的很好,它更像是一个机器或者体系化的运转了。甚至说,你可以任意换掉一两个、两三个人,好像对这个机器都没啥太大的影响。嗯,而且他们优势有很多,呃,有操作系统,有 Google Workspace,对吧?然后,对,你刚才说一个点很有意思,你说发一代非常厉害的模型,呃,没啥用,要持续的 deliver 模型。
那这种持续性,你觉得是有什么带来点?第一,你每年要几百亿美金的投入;第二,你管理层。方的魄力、认知、战略的bet,第三,你要有牛逼的团队。啊,其实我感觉持续第六轮牛逼的模型,是对所有科技公司的一个大考。其实这个考验是巨大的,有没有公司每年能投几百亿美金,连投三到五年?管理层是不是有这个认知?有没有这么多人才的吸引力、号召力?
而且要对的团队,而且要有战略的bet。今天只有一个模型都不够了,而且要跟产品策略结合。所有人去做coding,你也不能。全部都只follow,那你肯定也站不到前面,肯定要有自己的bet,对吧?嗯,在call back你之前说的一句话,就是你说你提到on topic的时候,说当所有人觉得RL强化学习好的时候,他们也没有把强化学习当成神,也没有去做。
所谓的 reasoning model,而是选择 bet 了 coding,嗯,这成就了 Anthropic 今天的地位啊。那同样,今天当所有人都在追赶 coding,嗯,我们是不是能够跳过这一幕去直接 bet 下一波?你觉得它成立吗?既然 coding 都做慢了,那跳过它可不可以呢?我觉得没必要跳过,它可能还是一个基础能力。
嗯,除非有一种可能,就是 C 端这个个人助理,未来可能真的非常重要。C 端可能跟这个高价值任务是融合的,也有可能 Coding 和 Agentic 这种高价值任务的能力,最后大家都能追上来。但你掌握了 C 端的分发,可能还是很重要。除非说你说你去做数学,对吧?但数学能表达的东西比较有限,或者你去做世界模型,但世界模型今天还没有 proven。
嗯,包括你做下一代范式,但下一代范式呢?这几个 frontier lab 都投入很大,有可能是在巨人的肩膀上实现的。我不知道跳过去做啥,就是好像今天这个大金矿也挖出来了。从 Chatbot 第一幕到 Coding Agent 第二幕,到第三幕就是一个 automated AI researcher,好像这三幕。
就是主线,你跳出去是不是就偏离主线了?那现在来总结一下上面这些硅谷御三家吧。对,我觉得硅谷预算家过去三年,有时候你觉得OpenAI无敌,三四个月前又觉得Gemini王者归来,今天是Anthropic春风得意。我是感觉每个公司都有自己的窗口吧,各领风骚一百天,嗯,还是会交替领先。以这三家的人才资源和组织。
我感觉都不太会轻易掉队,短期是被低估了,你就买谁的股票就可以,因为这些公司年底都IPO了,有可能未来就是他们IPO以后。投资者会卖其他的所有科技公司去买模型公司,模型公司可能就是未来科技投资的主线。就刚才提到,能做好的模型或者做好的AI产品是,对所有科技公司的一个大考。嗯,做不好可能就是要被淘汰的,嗯,做得好可能就是受到投资者喜欢的。
好的,again,这里不作为投资建议。那除了这个硅谷御三家,我们也点评一下 Meta、TBD 和 XAI 吧。你看一季度,呃, Meta 在重金挖人之后开始交作业了。你看好小扎和埃赞道王主导的 Meta 大模型吗?他们在到底在 bet 什么呀?我觉得 Meta 是最有机会的挑战者,其实已经取代了 XAI,成为了硅谷四号种子选手。
呃,其实 Meta T B D 这个 team 人才密度是很高的,也知道各家的诺号,因为他们从各个 AI lab 汇聚过来,其实进步速度是很陡峭的,九到十个月做出了一个还不错的 model。嗯,我觉得长期模型能力上是有机会开叉 tier one。嗯,其实你看他们思路也比较简单,就是七八成就学 Google 对标 Gemini 对吧?
也有 Nano Banana。嗯,他们也有一个 Mongo 文生图的模型,多模态模型嘛。另外可能百分之二十也也学 OpenAI 吧,就是 OpenAI 的 Post Train 和 R 做的比较好。嗯,但是我感觉 Meta 这边的产品战略还不知道是不是清楚。即便它未来有一个好的 model 了,但总是要把这个好的 model 最后 deliver 到产品上的。
我感觉以 Meta 的。特点可能还是做个人助理,个人朋友会好吧,就是更低门槛,或者就是把 Open Cloud 做一个更低门槛的,包括你看他们收购了 Manus,如果真的能用好 Manus,有可能也是。挺有机会的,啊,我我觉得是后面比较期待 Meta 到底推出什么样的 Agent 的产品。但说实话,我是感觉中国公司的中国团队的产品创新力都比 Meta 要强的。
其实硅谷公司是擅长技术模型这个 layer 的创新,其实中国团队是擅长产品的创新的。我是觉得 Meta 产品创新力并没有字节那么强。其实你产品和模型 Coding 咱一起做好,向下反推模型可能也是一个思路。但另外就是长期看,我不知道 Meta 这个团队稳定不稳定吧,因为砸钱这个文化也不知道是不是健康的,因为因为你砸钱,很多钱,很多人就是为了赚钱,就在这。
先苟着,先先先先抵着份成绩单好了,就可能就不容易 take risk,愿意去冒险。我感觉 OpenAI 还是愿意冒险的一个文化和组织,创新力是比较强。Minas 被吸收进了 Meta,他们现在有什么整合动作吗?对我之前以为会集成到 WhatsApp 和 Ins,但好像一直还没做。Manus 的收入涨得挺快的,非常快,因为这个产品,因为大家一直在喊 Harness 这个概念。
其实 Manus 我感觉是 Harness 的鼻祖,是一个呃独立团队把 Harness 这些东西做得很好。那今天模型公司把这 Harness 这个概念像宗教一样喊出去了,其实 Manus 更像是 Harness 的这个这个鼻祖吧。看看后面能不能整合吧,就是主要可能是跟TBD的这个这个关系。你觉得MindS进入到Meta会发展的更好吗?
不知道。你觉得MindS卖便宜了还是卖贵了?卖便宜了,肯定卖便宜了。但是再过一两个月,Opus都出来了,卖那才怎么卖啊?我是感觉AI的beta更重要。整个大水漫灌,每个人都往往上涨,就是有可能我们今天不需要想中局问题。大水漫灌,每个人都涨得很快,就是马纳斯当时如果更快,是可能有机会更快、更快、更早的做到一个B零、两个B零的AR,有可能他今天就是一个百亿美金估值。
其实中间可能。还可以更快。好的,那马斯克的xAI呢?他们最近也是刚刚经历了人事的大震荡,内部到底发生了什么?我感觉跟他们错过整个Coding的赛道也有关系,对吧?而以及我在想,为什么马斯克他能够把 Tesla FSD 做的挺好的,做 F3 却不行呢?就是做 FSD 和 XAI 这种大模型,它的本质差异是什么呀?
对我感觉X I短期是有点掉队的,因为最核心团队其实都离开了。其实Founding Team都挺强的,都是世界级的,国栋、字行、Tony这些。嗯,我觉得短期X I是挺难的。嗯,至少可能现在不在一个正确的路径上吧。除非说一龙哪天又大调整了,就是你说它最重要的问题,我觉得还是战略摇摆吧。最初可能 Elon 相信大力出奇迹,弄几十万卡的集群 per train 很大的模型,呃,但是好像好像不是这样。
你得把数据做好,你得把 data efficiency 做好。你盲目的 scale 这个模型参数,好像并不是问题的根本。今天的包吞奈克啊,不是在模型大小,而是数据。嗯,别人可能用一个小你十几倍的模型,可能比你做的还好,这个就有点尴尬。呃,甚至说中国的蒸馏的模型可能都比 X I 今天要好,对吧?然后你比如说之前 X I 还想白糖多模态,它音频做的也很好,但好像这个也不,嗯,不是什么主线,对吧?
好像也没太大用。可能车上你跟 Grok 对话还可以,那中间可能也想做 Chatbot 做 AI 搜索,啊,今年可能想 All in Coding,嗯,其实。这这个战略摇摆呢,就会让团队很乱。你这个事儿刚上手还没做热,伊朗可能没有耐心,又拉去做另外一个事儿。我觉得还是耐心可能不够,战略不够坚定,就把摇摆的比较快,而且团队老是换人嘛。
所以我觉得这个崩溃的源头可能是伊朗可能对 founding team 有点不满意,就是但其实 founding team 是最世界级的一个团队,其实这个是有点有点有点没有耐心了感觉,然后。我觉得确实有像你说的,呃,跟特斯拉 F S D 这个区别。其实做好模型的数据可能是一个要有耐心、比较长期的一个工程,呃,或者偏 research 的 test,到底什么数据是好数据,怎么做的更好。
但 Elon 呢,可能好像还是希望短平快,整个 feedback loop 最短,恨不得两个星期就就看到效果,对吧?所以就会这种文化就会导致短团队。追求短期的效果而牺牲长期的质量,所以有一些 long term 的问题可能并没有准备好。然后你比如说这个数据质量到底怎么样,infra 的框架到底怎么样?
但但我感觉也不代表 xai 彻底就没戏了,因为他手上还有很多的 gpu,呃,而且耶伦作为一个顶级企业家,调整能力又特别强。包括他搞数据中心,搞这个新的 Fab 这个芯片厂,我感觉更像是个人的宏大愿景。其实这个东西。嗯,可能需要的时间还挺长的。有没有真的能弄弄起来一个团队帮他 deliver
这个?我感觉 A G A 的竞赛是比其他很多领域都要竞争激烈的,就很像是你开着 F 一的速度跑一个马拉松,而且在城市里跑,对吧?
所以你需要百分之两百、百分之三百的聚焦。如如果 C E O 和 leadership。不聚焦肯定是不行的。我我觉得伊朗是不不够聚焦的,而且A A I的投入还是一个马拉松,得持续投入。能不能给我们讲讲一季度还有一个非常火的新词,就是Honeys Engineering?对,我觉得这个提供几个思路吧。嗯,未来我们应该把AI的Agent当人看,应该把它看成一等公民,跟我们是一体的。
那人应该有的东西,agent也应该有,对吧?你人类的知识工作者有工作的环境、工作的电脑、工作的各种信用卡,对吧?那未来可能在一个平行世界,你也要给agent去搭一套agent的,作为人类作为一个一等公民需要的环境,对吧?我觉得这是一个思路。那第二个点呢,就agent想做好,一方面是模型,还有一方面是harness。
那agent,你就把它比喻成就像是一个人加入到一个公司一个团队,有些公司有公司的这个管理和环境,它能让一个正常的人他的下限很高,有通过管理和组织一些约束,对吧?嗯。那那其实A质呢也需要它的管理学和组织,那那这就是Harness的这个这个意义。其实有了Harness以后呢,其实普通的模型也可以做高价值的任务了,加上过去。
Cloud整个需求的溢出,它接不住,所以呃,非SOTA model就是包括开源的很多模型,呃,也能被用上了。我觉得这是一个更大的意义。然后,我觉得第三个点就是说,更多带来一个思维 mindset 的变化,就是说以前是。看To C和To B,对吧?传统时代,但今天是到底是To人类还是To Agent?
如果是To
Agent,那可能看重的不再是DAU,可能是Token的Usage或者Token的价值Margin,这个可能更重要。因为以后用什么工具可能不是人决策了,可能是Agent去调用哪些工具去决策了。对,我觉得这几个思路。刚才我们看了硅谷御三家,那你对国内的御三家有没有一些呃观察和评价?因为你看硅谷的御三家也有一些分化嘛,有有的过去一年在
B2C,有的在 BAT anthropic 这种高价值任务。
那国内呢,他们是不是也有一些分化?我感觉国内好像都在追求 anthropic 的路线,嗯,这好像成为了一个共识。一年前好像还不是共识。这个共识是最近几个月吗?过去三到六个月吧,因为C端已经没机会了。好像大家也意识到,Coding和高价值任务这条线上线好像比C端要更高。就是国内的广密、MiniMax和智普都在Bet on Dropping这条路线。
那豆包呢?豆包看起来是在C端做最好的,因为大家其他几家都是觉得跟豆包没得打才转转型的。我觉得 Coding 和 Agent 是不不能输的,豆包肯定也是大概率都能追上了,而且可以有可能做得更好。我觉得最后可能还是拼组织能力啊资源吧。你觉得国内这些模型公司现在的胜负手是什么呀?我觉得还是综合的,其实不是一个能力,最后就取胜了。
你说我一个人才牛逼,我一个方法牛逼,嗯,我一个bat牛逼,我感觉是非常综合的。AI今天进入了一个叫工业化时代,我不知道未来会不会进入无聊的大厂游戏,有可能会这样,大厂游戏。无聊的大厂游戏,为什么这么说?无聊大厂游戏,就是有些窗口已经关掉了。那发展到二零二六年,你觉得模型公司的竞争到底在争夺什么,在追求什么呀?
我觉得抛一个观点吧,其实模型可能就是新一代的操作系统。未来最领先的几个模型,可能就是世界最重要的基础设施。你生活的问题也是问它,你工作的自动化也是它,你研究科研的支持也是它,可能它的重要性比今天的Google。对世界基础设施的支持还要重要,嗯,未来模型可能就是支持应用的无限扩展,嗯,这就是AGI的,对吧?
那也支持形成了一个新的生态。操作系统的定义呢?它就是支持应用的无限扩展,可能就是今天的 agent,嗯,慢慢它也会形成一个新的生态,就像安卓 iOS 这个生态,Windows,那也可以兼容各种硬件,不仅在你的电脑、手机,可能还在你的眼镜各种地方,嗯,过去。称得上操作系统的,可能就是 Windows、iOS、安卓和微信吧,嗯。
有可能,不管你追求工作助理 coding,还是生活助理,呃,ChatGPT、Gemini、豆包,有可能最终最终大家会都会走向世界的基础设施一个 global GDP 的 OS 操作系统这种方向吧。今天看,你觉得 AGI 的路线图和时间表在你心中有没有发生什么样的变化?以及它对社会层面会产生怎样深远的影响?
社会应该怎么消化这个技术的巨大的变革?就是刚才聊到,我感觉路线图更清晰了。从 chatbot 到 coding agent,到 automated AI researcher。这三段路,然后以及路时间表,我感觉会加速的更快。以前好像说,好像还需要两三年。我感觉好像也许今年年底或者明年初,可能就有一家公司宣布实现了AGI了,然后。
社会影响,我觉得很多人确实没做好准备,因为整个割裂感太强了,就是几百个 researcher 或者两三千个 researcher
在前沿看到的东西更多的,但其实这些信息是没有传递到社会上的,嗯,所以社会的准备肯定是不够的,对,因为这里面最本质的一个点是,人类的知识和智力变得廉价了。以前我们通过学习读书,获取了知识,可以有个工作,嗯,但是今天这些智力和知识呢,好像模型里面都有了,嗯,被大幅的压缩了,呃,变成了一个计算资源或者token这种体现,那我我就感觉有可能。
百分之七八十的人在社会上的价值和意义有可能会发生微妙的变化,因为以前人类觉得自己是最聪明的,但你发现模型比人类要聪明了,好像我们不是最聪明的一个物种了,嗯,所以这个是。比较有趣的,以及有可能AI会带来很大的一个通缩。嗯,你像我用了ChatGPT和Cloud之后,我再去找顾问和买其他软件的需求就小了很多。
嗯,它一个产品可以满足我很多的需求。呃,有可能长期看很多SaaS也是消失的。我不知道印度的IT外包现在活得怎么样,有可能。印度的IT外包已已经不如模型了吧?嗯,包括今年我感觉美国的本科毕业生是就业率历史新低,因为AI今天已经把工作两三年、三四年的专业的工作岗位、工作环境都已经被自动化了吧?包括专业的程序员,嗯。
所以,今年肯定是,嗯,人类开始面临失业。比较痛苦的一年嘛,有可能今年百分之三十的工作岗位就没了,嗯,那这些人没有工作了之后会干嘛呢?我觉得挺担心的。你看Meta裁员裁了一点六万人。我不知道这一点六万人以后会干嘛?他未来可能再裁一点六万人,有可能微软也不需要十五万人,有可能三万人,有可能比今天十五万人干的更好。
嗯,就人才成长和培养的路径,好像被AI给。拦腰截断了,就是我十年前毕业,可能还能有个成长工作的环境,但今天好像是另外一个环境了,嗯。对,你预计我们俩这个工作能还能干多久啊?我觉得你的IP是比较值钱的吧,有可能我们下一期的播客不用我们自己录了吧?但我调研了一下,好像效果还不太好,有可能下个季度的播客可能可能他就根据我的笔记就自动形成一个播客。
其实我们今天的播客,我感觉已经半自动化了。这个播客的大部分的提纲,其实是 Claude 的帮我写的,因为我我过去几个月变成 Claude 的重度用户,他根据我的一些 notes、一些记录的一些东西,又根据过去,呃大模型季报的框架。我感觉有可能,我我我写东西已经没有Cloud Code写的好了。投资的工作会一直持续吗?
存在吗?有可能,我觉得就后的最好的模型公司,有可能就是最好的投资了。那你就分别持仓就好了,你也不需要干啥了。但是技术变化非常快嘛,我觉得没有人是安全的,每个人都有危机感。你说现在,当智力和知识都被压缩进了模型,变成了模型的 skill,那人未来去干什么?我就去创造吧。如果很多人有有创造力,还是能搞出来东西的。
因为以前我想创造,我没有那个支持。嗯,有可能一个人、两个人未来会做出很惊天动地的大事儿。因为整个Infer啊,从你有想法到跑通代码,嗯,可能很快,有可能创造力会被极大的释放。第二,审美那个Taste可能还是很重要的。有审美和 taste 的,嗯,最后可能还是会抵离不很多东西,因为人以前有很多的想法是无法实现的,但今天整个基础设施极大的繁荣,有可能都能实现,对吧?
比如说以前你要做一个。有影响力的媒体可能要几百个人,现在好像一个人,对吧?做个自媒体也非常有影响力,这是这是整个基础设施极大繁荣的结果嘛?如果AI开始大规模的取代白领,能不能对我们的听众朋友们给一些建议?AI取代的是不拥抱AI的人,积极拥抱AI的人可能是受益者吧?那在二零二六年的一季度,你对投资有哪些新的思考?
呃,我觉得投资上有可能最好的三五家模型公司,如果成为全球 GDP的操作系统,我觉得每家可能都是十万亿美金,未来加起来三五十万亿美金。嗯,我对这个的 belief 越来越深了。你最理想的 AGI 的 portfolio 有没有变化?我觉得没啥大的变化,就是更极致一些。一句话总结就是说,你要投能持续做好SOTA model的公司。
我觉得这个指标可能是未来投资最关键的指标,就是你要做一个好的AGI的portfolio。嗯,有可我认为可能就是模型吧。我我个人的主线一直是模型,我觉得其他支线任务是比较少的。嗯,我我个人反正八九成的精力都在模型上,嗯,其实就做一个模型基金也挺好的,就是现在策略反而越来越清楚,就是你你投资最大的一个bet就是全球最领先的三五家模型,未来都是十万亿美金,啊,那你。
三年后、五年后,甚至七八年以后,你全球GDP的百分之三十五十都已经被模型 automate。那那如果你相信这个,那就表达的更极致嘛,那就全仓做一个模型基金也挺好的。所以今年可能。更聚焦,也更相信这个策略了。对,应该更极致,更极致的表达。问一个中局问题啊,你会怎么看这些模型公司,或者说模型竞争的中局啊?
嗯,还可能会有时间窗口让新的模型公司出现吗?对,其实刚才提到了几个要素。第一,一个科技公司每年能不能投三五百亿美金的投入,而且要持续投三五年?你看小扎一年大几百亿美金,嗯,第二个点就是创始人和管理层有没有这个认知和魄力。你没有认知就没有魄力,你就不敢买卡,你怕买了卡砸手里。嗯,那即便没有认知,那如果有魄力,就像小扎那样,能放手交给团队,也可也也可能也可以。
嗯,不知道最后结果会怎么样。嗯,第三呢,你也得招到起码上百名。世界级的AI的科学家,对吧?其实小扎砸那么多钱,好像也是有道理的,就买时间嘛。然后,但只有这三个还不够,就你只做一个通用的模型好像还不行,还得有一些战略的bet,嗯,产品的,go to market的方式,对吧?嗯,而且你有了钱,好像今天都不一定买到了GPU。
我感觉再出来新的模型公司不是没机会,但这个难度比我们想象的大非常非常多。这就像我们想再造一个台积电,你说。它有一个窗口和资源限制的问题。硅谷最近也出现了很多 new labs 新型实验室,有你看好的没有?我不知道这个世界上还会不会再出现更多的 OpenAI 和 Anthropic 的机会,因为 GPU 太有限了。
嗯,资本其实也比较有限。嗯,其实 OpenAI 和 Anthropic 还是挺重视。下一代范式的内部投入也很多,嗯,我觉得优秀人才的流向最能说明问题吧,就是你就看最优秀的A I人才会不会流入哪个Neural Labs,嗯,我觉得今天好像Neural Labs的技术路线还没有收敛啊,真正的Scaling还没有开始,嗯。
呃,data的skill还没开始,所以可以再观察一下。那整个一季度,硅谷还有哪些前沿趋势值得分享一下?可能最实际的 A I R 最说明问题吧,因为 Anthropic 和 OpenAI 可能公开的已经三百多亿美金和两百五十亿美金的 A I R 了,当然,但是它俩口径可能不一样。我估计可能今年底可能都八百到一千亿美金,明年一千五两千亿美金。
其实他们已经是新的 MacSeven 了嘛,嗯,再往下就是 Cursor 可能二十五亿美金,嗯,技术红利都很强,涨得都很快。再往下就 Proplastic 可能超过了五亿美金,嗯。在之后,声音的两家也挺快的,那个 Elevenlabs 和 Suno 可能都超过了三亿美金。嗯,其实 Manus 和 Lovigo 应该也都超过了四亿美金了。
其实成长都很快,GenSpark 发展也特别快。我感觉头部的 AI 产品,AR 可能主要是这些吧。然后硅谷我感觉在医疗投的也比较多,比如说 OpenEvidence 或者 Arbridge,呃,这两个还是发展挺快的。嗯,对,我们刚才聊了很多都是模型公司,那你怎么看其他的一些方向,比如说机器人啊、AI硬件啊、Vertical Agents的这些等等的新的机会?
对我理想的AGI portfolio就是最领先的三次加模型分别放百分之二十,剩下的百分之二十,比如说百分之十在。机器人百分之十在 AI for Science,还有可能百分之十再去 Agent,Infra 这些,啊,比如说 Agent。那个平行世界需要的东西,我觉得机器人和science可能是大模型之后下一个大的平台吧。
我对这两个是比较兴奋的。然后我觉得有可能机器人在未来六到十八个月是有质变的,可能架构突破了,技术路线也收敛了。嗯,data的scaling和真的scaling开始了,嗯,反正现在机器人数据采集的需求挺多的,呃,最近像那种第一视角、ego-centric的这种采的很多,呃,包括遥操作的,包括五米手套的,嗯,其实大家刚刚弄清楚这几类数据怎么用,有可能。
后面data的skill更好,架构也有一些突破,有可能机器人会发展的更快。我对这个还挺乐观的,就是因为这里面中国团队会有更有优势。你发现以前硅谷公司只觉得算法重要,但是没有硬件完全不行,最后。过去一个季度,我感觉是大家都开始重视硬件,都要在深圳招人了。站在今天,你怎么看待AI应用公司啊?你觉得AI应用的机会是变大了还是变小了?
现在还相信One PC,就是一一人公司吗?如果模型平台就像我们说的变成全球的基础设施,它足够的
powerful,那每个个体都可以做很多事情。就像微信的自媒体,我们很有影响力;就像抖音的创作者,每个人创作一个内容都可以传播很很大。我觉得玩PC还是有可能的吧,可能就是未来的一个常态,就模型就变成变成一个新的平台,足够的powerful,每个人都可以做很多的事情,从一个idea到代码跑通到最后revenue实现,可能是非常非常高效的,也有可能就是说,我最近听到一个比较好的指标,就说你消耗了一百美金的token。
你能能不能赚到一百一十块钱?你得把这个 ROI 跑正。其实很多人是没有跑正的,或者这个闭环是没有跑通的。我觉得这个可能是一个比较重要的指标。今年会是爆发点吗?我觉得期待吧,就是我觉得过去的一个季度,AI已经进入那个基点了。其实今天是在加速的,显著加速的。说说你自己吧,过去一个季度你自己生活有什么变化没有?
状态?我觉得很担心跟不上AI的进步,因为每天每个星期进步太快了,学习压力太大了。然后,过去一个季度,我从 Chat GPT 变成了 Cloud Code
的重度用户,我感觉我的生产力确实提升了很多,嗯,但我依然还没有像那种。塔尖的开发者一样能消耗那么多token,嗯,你现在能消耗多少token?我的Claude的一百美金呢,我是一直没用满的,大部分时间是用不满的,因为做research整个跟coding也不太一样,持续消耗,嗯,对。
We'll explore the new world from here, shouting out so the clouds can't hear. Every heartbeat drawing the map we steer. We'll explore the new world
from here, step by step turning doubt to cheer. We're the start of the story. This world we'll hear. We'll explore the new world from
here.好了,今天的节目就是这样。
这里是商业访谈录,是一档由语言及世界工作室出品的深度访谈节目。你可以到公众号关注我们的工作室,获取更多的信息。我们的公众号是语言及世界(Language is World)。我们希望和你一起从这里探索新的世界。