127. 大模型季报跨年对谈：和广密预言一场AI War、两大联盟和第三个范式Online Learning 文字稿

不能称作是 AI Bubble，更像是 AI War。嗯。AI 可能就是得看作这是新的国防或核武器一样的东西，所以很多人可能就会砸光最后一分钱，也不会轻易下牌桌吧。你看，Google 越强，越会形成一个反 Google 联盟；Open 越强，也会形成一个反 Open 联盟。其实，你看 Open 出生的初衷，不就是为了挑战 Google 嘛？

所所以有一个很大的概率，就是说，未来机器人世界模型的突破，可能不一定是今天在座的这批人。有可能今天在座的这批人是上一代 NLP 的一样的结果，确实是包论。嗯，就机器人最大问题还是不泛化，对吧？做这个播客很大的一个意义就是，要有 passion 去鼓动中国的科技公司多买卡，给年轻的研究员更多的搓卡的机会。

Hello，大家好，欢迎收听张小军商业访谈录，我是小俊，这是一档由语言及世界工作室出品的深度访谈节目，我们希望和你一起从这里探索新世界。这里是全球大模型季报的第八集，也是我和广密跨年对谈的第三年了。那这期节目将带你看到，在对 A G I 开始充斥着现实主义情绪回归的当下，全球的 A I 竞争它形成了怎样的战队、阵营和联盟？

各个前沿实验室在探索哪些新的范式，以及硅谷又涌现出了哪些新型的研究实验室？如果你对全球大模型季报有更多的想法或者建议，欢迎大家在评论区里多多给我们留言，我们都会看到。那二零二五年的最后。期待我们和 AI 共同进步。Hello，广密，还是给大家打个招呼吧。Hello，我是广密。时间过得好快呀，这已经是我们的第八季季报，第三年的跨年对谈了。

你觉得我们一起录制这个系列这么长时间，给你的生活工作带来哪些变化？你觉得做内容好玩吗？啊，我觉得做内容蛮有趣的吧，就是呃。反馈闭环比投资快，就是，而且播客的听众很多都是一线的从业者，那个很多人水平也挺高的，那个很多人听了后找我聊天，呃，也认识了很多朋友吧，我自己也学到了很多东西，就是一线的人说受到很多启发，这也是一个很好的正向鼓励吧。

我觉得希望，呃，每个季度能系统的讲一讲，就对自己和对团队也是一个阶段性总结，然后也希望这个让听众更好的理解这个全球AI的进展，然后大模型季报也希望纯粹的做一个。公益科普的内容吧，是输出真的有用的信息。反正做着做着的过程中呢，坚持做播客，慢慢的也有了一个更大的意义，或者或者说一个 passion，就是说叫推动中国AGI的骑手和布道者，就是布道和科普自己相信的东西。

嗯，希望中国也有一个自己的硅谷吧，也希望对华人创业者有些帮助吧。嗯，过去这个季度似乎整体的AGI叙事在变得更现实、更谨慎。你的感受和状态是什么样的？呃，我过去一个季度，呃，依然还是把大部分时间精力花在了AI研究员身上。那个，因为技术变化确实很快，呃，还要持续的理解技术的进展。嗯，今天又到了一个比较关键的时间点嘛，比如说，啊，Coding从年初几亿美金硬生生的长出来一个。

百亿美金年化营收的一个新市场，对吧？后面还还有多大？然后会怎么走？啊，再比如 Google 王者归来，对吧？对后面格局的影响。嗯，再比如说，伊利亚。公开说 scaling 停了，我们应该怎么理解？嗯，包括还有下一代范式 online learning 已经在孕育了，这个可能还是一个核弹级别的突破，对吧？

所以接下来应该关注什么？呃，哪一个是真问题，哪一个是假问题？呃，这个时候感觉理解技术的本身变得比以往更加的重要，所以理解了技术本身，对二六二七年做正确的战略下注是非常有用的。你看，最近大家都在说 AI bubble 啊，那站在二零二五年的尾巴上，你有嗅到泡沫的味道没有啊？你对于二零二六年是乐观更多还是悲观更多？

呃，我担心过一阵子，现在结论是不用太担心，嗯，不能称作是 AI bubble，更像是 AI War。嗯嗯，这是每个科技巨头。都输不起的战争或军备竞赛，就是甚至说，这也是中美国家战略都输不起的一个战争竞赛，就是AI可能就是得看作这是新的国防或核武器一样的东西，所以很多人可能就会砸光最后一分钱，也不会轻易下牌桌吧？

为什么你说每个科技巨头都输不起？呃，就是颠覆性太强了。你举一个现实的例子，商业上就是说，你你看现在每个开发者或者企业，过去都是首选AWS或者Azure去做应用开发部署，对吧？现在是首选用哪个模型，GPT Cloud Gemini，那云厂商就被白牌化了，就像当年惠普Dell一样，其实就被藏到后面去了。

然后我们在推演C端，呃，就看豆包手机这个例子，呃，如果AI Agent。成为流量入口了。那今天的 Super App 其实就被短路了。那那今天的 Super App 其实是靠信息不对称赚钱的。如果 Agent 让信息分发这个充分对称了，嗯，那那像Uber、像携程这种信息中介平台，其实就不应该赚那么多钱了，对吧？

你你看，再往去打Uber，经常被平台抽个百分之五十，司机连一半都不到。那那传统，甚至说传统搜索。也不应该赚那么多钱，所以今天的科技巨头他又要防守又要激进的进攻，嗯，对，就是这是商业层面，就是如果从国家战略层面，我觉得AI也应该成为这个中美战略重点之一吧，就是叫再重视都不为过，其实输不起的。对A阵呢，会带来重新的流量分配，有可能会打掉现有的平台。

那你觉得为什么大家会谈论AI Bubble呢？这次AI Bubble的导火索是什么呀？我看你们前段时间也开了研讨会来讨论这个事儿。对，呃，主要原因还是十月份的时候，Sam 提了一点四个 T 那个问题嘛，三十个 G 瓦的那个算力建设，嗯，G P U 都是按六年摊销嘛，那就意味着 OpenAI 平均每年要烧掉两千多亿美金。

那OpenAI其实到二零三零年，你看它的公开的预测也就两千多亿美金的年营收，对吧？那未来五年累计加起来的营收大概五六千亿美金。其实从商业和现金流的视角，那那短期肯定肯定是算不过账的。那那也也不知道怎么赚回那么多钱。嗯，说实话，今天也不知道赛姆为什么要花那么多钱，对吧？但但我觉得有一个明确的是。未来两三年，Open的现金流是没啥问题的。

就是你看最近有个新闻，那个按八千多亿美金估值再融一千亿美金，对吧？其实其实Open自身的现金还是充裕的。但这一点四T呢，就听着比较大，其实大部分的投入都是二八年和之后的。一个多月以前，嗯，就Sam上了一个播客，在主持人连续追问OpenAI如何为一点四万亿美元的承诺买单的时候，他那个问题回答的很不好。

他说如果你想卖掉你的股份，我可以帮你找买家。够了，这个也引发了大家对于OpenAI信心的波动啊。那你能不能拆解一下OpenAI的收入构成？嗯，Open有可以看得清的收入，也有看不清未来潜在的收入。嗯嗯，如果看得清的收入，我们就拆一下，就说订阅、广告、电商，对吧？我们就比较乐观的假设啊，二零三零年之前。

它做到四十亿的月火，二十五亿的周火，啊，十五亿的日火，对吧？那那假设它的订阅做到百分之十的付费率，那就是四亿用户，呃，这个是非常合理的啊，就是因为，嗯，对标 Office，Office 应该也是三到四亿的付费用户，但很多是企业帮员工付费订阅嘛。那个四亿的付费用户，每个用户假设是两百美金的年年费，这其实是八百亿美金。

其实 Office 也是几亿的付费订阅用户，几百亿美金的生意，对吧？包括 Netflix 也是几亿的付费订阅用户。其实我我直观的感觉，Chat GPT 应该比 Office 和 Netflix 要大。然后这是订阅，嗯。嗯，再算，电商和广告，就假设不付费的用户就要看广告，那我们就假设每个周活它的阿普值，比如二十美金、五十美金，对吧？

假设二十多个亿的啊周活，那其实这也是五百到一千亿美金的一个营收，对吧？嗯，那。第三个就是卖API，嗯，你拍脑袋也能做到五百到一千亿美金。其实他们是很有规模效应的。其实模型就是新的云，这这跟亚马逊当年有了电商业务自己做云是一样的逻辑。那其他的可能还有一些Agent其他的收入，我觉得这几块都看不见的，差不多做到两三千亿美金营收一年，对吧？

那那其实相当于今天的Meta或者自己一样的，啊。所以从这个角度看呢，就是只多了一个互联网平台，其实也没啥意思。但那肯定也是抢了一大块存量的生意的，那个，但是它很大的也是增量的东西啊，对。你刚才说的这几个是呃看得清的收入，那看不清的潜在的未来的收入会有什么？对我觉得这个是比较有意思的，就是我们总是缺乏想象力的，就是再让我们回到AWS诞生的头几年，抖音诞生的头几年，其实大家都不会觉得这俩能做到千亿美金营收，对吧？

包括再让我们回到。二零二三年也不会想到 OpenAI 和 Anthropic 估值能涨这么快，哪怕就回到今年年初，当时咱们播客提了那个 coding coding agent 是今年主题，嗯嗯，就十个月十个月前看 AI coding 这个单一行业，大家也不会觉得一年能涨十倍，硬生生长出来一百亿美金，对吧？

嗯，我觉得 AI 的潜在的看不见的营收规模是很大的，我我觉得是会有惊喜的，因因为因为因为这可是全世界最聪明的一批人。这个最牛的科技公司和最厉害的这些大佬都在努力搞的一个市场，对吧？那如果具体来说，我觉得Open真的想赚钱，有有有两种演绎的潜在方向，嗯，一种是。Agent真的开始work了，对吧？真的端到端替代劳动力了，赚到这个工资的预算不再只是一个工具。

比如说，全球白领有十个亿，OpenAI就这个靠输出十亿白领的价值，这个自动化白领的工作，那每个Agent白领这个工资，比如说一千美金或者到一万美金之间，对吧？那就是一个T到十个T的营收，这个这就很大了。那那那其实你看白领里面。最快的还是软件开发市场，全球软件开发市场大概一千五百亿美金，对吧？今今年 AI coding 其实只有一百多亿美金，还不到百分之十。

那未来几年涨到百分之三十或四十的渗透率，我觉得未来肯定还会更高，对吧？啊，那另外还有一个比较星辰大海的就是。叫大规模做人做不了的增量的高价值内容，比如说 coding 可以重新写库的，对吧？这个科学发现，这个治愈人类所有疾病，对吧？嗯，帮我们研究，比如说室温超导的材料，对吧？这个AI做AI的科学家，基础物理很多东西，我觉得这些潜潜在价值都是非常非常高的。

那这里的前提也是模型更加可靠，端到端能力更强，对吧？也需要比如说Online Learning这个本质上的突破。所所以，我们现在只能解释AI这件事儿说。更像国防或者战争的军军备竞赛，这个未来的潜力巨大，每个人都输不起，所以那我们就说巨头每个都不会放弃，都会投光自己有的最后一分钱，对吧？那个其实我觉得这个一定程度上是超越了商业回报。

输了就有被颠覆的风险，嗯，正因为这个太重要，所以大家不会让 Google 一家独大，也不会让 Open 一家独大，嗯，所以英伟达也好，微软也好，亚马逊也好，对吧？会继续支持 Open 和和 Anthropic，对吧？Anthropic 这个就很像一个巨头的棋子的价值。这个，因为任何一家都很大，都可能危对其他家造成威胁，所以这里面有很多这个巨头博弈的一个平衡。

但我感觉就是商业上长期对AI的商业模式还是要抱着一个乐观的态度吧。那个，比如Agent真的落地后，我觉得对传统流量平台生意还是会有很大影响的。就刚才提到那个流量短路的问题。你说啊，Anthropic有巨头的棋子价值，那你觉得中国的这些公司有巨头的在巨头间博弈的这种棋子价值吗？好像中国的巨头都很强，独立的模型公司呢没有显著的比巨头这个领先，对吧？

那那自己和阿里好像都很强，腾讯也在 catch up。挖去了大神，你刚才说 OpenAI 有几块收入，你觉得它做起来广告和电商的这个速度会乐观吗？我觉得长期乐观，其实就是时间问题。就是历史上只要是大流量有粘性的平台，最终都是能变现的。那那这个速度，我觉得就取决于优先级的问题。嗯，可能广告和电商今天还不是最高优先级问题。

我理解的最高优先级问题是二零二六年底之前先做到十个亿的日活。我觉得这个是更重要的。我我觉得Open今天是被低估的。这个就就像当年很多人都觉得手机和短视频是没法做太多广告的，屏幕太小啊什么的。嗯，如果AI抢广告是一场存量的竞争，长期是要靠替代劳动力带来的收入，那这部分的gap本质上是AI能力是否能顺利的抢夺到这个劳动力市场？

你怎么看这个问题啊？我觉得核心取决于AI的能力边界走到哪，到时候是AI便宜还是人便宜？那AI便宜其实本质上是电费是不是足够便宜？我觉得现有的范式、现有的路径。还是有机会让模型比绝大多数的白领或者知识工作者聪明的，我觉得这个确定性是非常高的。那个弯曲，你看，专业的程序员已经找不到工作了。那个，假如说你是一个A轮的创业公司，你你要招一个码农，只要你抛出去这个岗位，很多人看到，我觉得是轻轻松松收到几百个甚至上千个简历的。

其实这个已经在发生了，就是工资劳动力的预算，嗯。你上面提到一个概念，就是AI War，就是AI的战争，这是一场全球巨头都输不起的战争。那现在纵观全局啊，你觉得它的这场战役的主要推动方有哪些？他们现在分成了哪些阵营？我们可以来做一个概览。啊，简单的分就是两大阵营，就是英伟达的 GPU 和 Google 的 TPU，对吧？

就是你你看 Google 首次。推出真正的sota的model，对吧？模型、芯片、云产品、端到端集成。其实Google更像是AI时代的苹果。上一期播客咱们专门花了一部分讲Google被低估了。我觉得Google长期确实会很强。呃，不过呢，就是英伟达生态下支持的OpenAI和Anthropic依然是优等生。

我我感觉这两家相比Google在人才密度上还是会更优质一些的。其实英伟达更像是AI时代的安卓的位置，在这个生态下，嗯。嗯，这两大阵营可能是未来一段时间的主线，就是大家想研究AI的进展，还是围绕这两大阵营，围绕最领先的这两三家模型。嗯，我觉得很多投资机会都是围绕这两条主线。去延展的，那那你从硬件的角度看，只要是需求远远的大于供给，嗯，那英伟达和谷歌两家都应该配置。

其实这两家不管说势均力敌哈，或者其他的，嗯，我们的一个感受叫交替领先，就哪一边跌了，其实都是加仓的时候，其实是应该有一些逆向的这个思考。今天这个时候，就是因为英伟达和OpenAI被低估了，那那呃，因因为什么呢？因为G P U综合还是对比T P U是更好的，缺点就是贵了。那个，但你你也没办法，就是台积电产能就是这么多。

那英伟达和OpenAI这条线。呃，其实还是被低估的。那个包括英伟达那个 Rubing 呢，也那一代卡，嗯，应该是能甩开 TPU V8。嗯，一个代际的升位的，对吧？而且英伟达已经提前占了台积电一点六纳米的未来的产能。其实长期 GPU 的优势还是会很强的。你看，你分成了硬件层之争和应用层之争。硬件层之争是英伟达和 Google，呃，应用层之争是 OpenAI 和 Google。

那如果再往后推演，你觉得会有什么样的走势？你看，Google 越强，越会形成一个反 Google 联盟；Open 越强，也会形成一个反 Open 联盟。其实，你看 Open 诞生的初衷，不就是为了挑战 Google 吗？马斯克当年提的。那所以，AGI 这个事儿不能只在极少数的一家或两家公司手中，也不能只在美国手中，这样世界才会更平衡一些。

嗯。那接下来我们依照这个全球大模型季报的惯例，我们来梳理一下现在的模型格局。嗯，有没有一些比较重要的观察？闭上眼睛，最想传递几个关键词吧。嗯，那个第一个就是叫交替领先，啊，第二个就是。Google和Open的市值两家公司总和能到十万亿美金，第三个就是，二零二六年能看到下一代新范式的信号，第四个可能就是。

AGI是马拉松现金流之战，这个待会可以展开讲讲。第五个，我们可以聊聊，就是AGI时代的投资和创业的策略，就是叫压注到技术成长的。最陡峭的之处，啊，就是最领先的模型，最领先模型技术溢出的红利，最领先模型需要的算力，嗯，我觉得这几个是最强烈的几个关键词的感受吧，我们可以一个个展开聊一下。嗯，你看今天全球这几个

top 的模型，包括 GPT 啊、 Claude、 Gemini，它的格局似乎依然没有稳定下来。

你刚才也说一个判断是交替领先，这个能不能展开讲讲？这会是一个常态吗？我觉得未来的一年，模型层面的交替领先，应该会是一个竞争常态。嗯，这里指的模型还是全球最领先的三家模型，GPT、Cloud、Gemini。啊，你看这三家。你从它的营收角度看，年底差不多分别是啊两百一十亿美金、九十到一百亿美金、五十亿美金，对吧？

总计差不多三百六十亿美金的年化收入。占了全球 AI native，营收的百分之八十到九十。我我们预估全球其他所有大模型原生的收入，差不多。四百多亿美金出头，那 X I 的 Grok 可能 maybe 三到十亿美金之间，其实还是很小的。那个，所以还是叫最领先的三家模型拿走了绝大部分，因为这三家的技术和品牌都是有很强的溢价的。

哪怕你领先百分之三、百分之五、百分之十，那你可以放放大效应，可以多赚很多钱。其实这个就很像。这个体育里面的球员对吧？为什么C罗梅西这个能力上没有比其他球员这个强个几十倍，但他赚的钱比其他球员强个几十倍对吧？那个我我觉得这里面最关键的一个判断就是最领先的三个技术模型，GPT、Cloud、Gemini，未来一段时间还是会交替领先。

那呃，本质的原因就是在现有的范式下，就是预训练加强化学习这俩。大家的know how，大家的方法彼此是甩不开的，人才也在流动，信息也在流动，就是想甩开就得新的范式了。其实我我我觉得内心认为，Google还没有显著领先，嗯，呃，但是呢，xAI和Meta还没有真正上第一梯队的牌桌，因为这两个战略。这个

bet 还没有那么清楚，嗯，其实 X I 和 Meta 呢，这事儿也有一个启发，你会发现，模型公司不是叫护城河很高，而是进入门槛非常高，因为要靠资本、人才。

嗯，其实其实前三家因为做的早，人才和资本的这个门槛比较高。嗯，那你觉得交替领先的这个模型格局，这个现象本身它说明了什么呢？就是现有的两个范式拉不开差距，大家只能在战略定位上有差异化。上一次博客主题其实叫模型在分化，那这一次模型的主题叫做交替领先。你觉得这两个观点是替代关系还是递进关系啊？呃，这两个不矛盾，应该是一个递进关系。

嗯，因为过去五到六个月，其实模型分化更明显了，也验证了我们上期播客的一些判断。嗯，其实大家在通用能力上你追我赶，对吧？甩不开。呃，但是都有了各自的战略的 bet 重点。你比如说 Gemini 三其实是在多模态是断档是领先的，对吧？但是在 text 和 coding，包括 agent，其实差不多也是追平 Open 和 Anthropic 之前的模型。

那个呃，text 能力其实感觉像是优先级放后了，那个多模态战略放前面了。嗯。那你再比如说 Anthropic 的这个 Opus 4.5，它还是 coding 软件开发领域最好的这个模型。Optus 4.5我觉得依然是被低估的一个，因为它做的任务更长、更可靠、也更好，还还更省 token。那个我估计还能后面能解锁很多东西。

那再比如说 ChatGPT 的 BAT，其实它就是。To C消费端依然是断档式的领先呢，差不多四点八五个亿的日活，对吧？还是 Gemini 可能五六倍的关系。那那 ChatGPT 长期想做一个十到二十亿日活的个人助理、个人朋友，那这也是一个战略

bet，我觉得他们会突出个性化能力，对吧？所以你看。Google的多模态，Chat G P T的朋友，Anthropic的Coding和Agent，那包括伊利亚的S S I或者这个Thinking Machines这个去搞下一代范式，所以我觉得这比较有意思的一个点就是模型分化这个点一个奇葩，就是说。

Anthropic专注To B，放弃了To C，专注Coding和Agent，这个战略Bet是很值得AI创业者去学习的，就是，就不然的话，Anthropic。早早就在这么激烈的竞争中就挂掉了，那个，所以大家在各自的战略bat之下，嗯，一定要做到这个鲜明的特点，都是要为这个战略bat。叫以终为始的，有一个你优化的目标，端到端的优化，这个向下优化模型，那本质是优化数据，对吧？

那那那你看，ChatGPT在C端其实体验明显还是比Gemini要好一些的。然后因为是对数据做了专门的优化，那Cloud在。to B企业或者知识工作者这个体验也是更好的，那本质还是对数据做了优化。嗯，你说 Miro 的 Think to Machines Lab 代表新一代范式，这个范式指的是什么呀？

啊，这个只是猜测啊。那个，伊利亚和米拉，约翰舒曼肯定是很懂OpenAI未来的roadmap的，对吧？其实这两这两个人没必要说再去catch up现有的model，肯定是想去拜堂下一代的。不管说online learning也好，continual learning也好，嗯，我觉得他们都是有自己的路线和一盘大棋的。

嗯。那你觉得今天再去争夺这个 SOTA 模型的位置还有意义吗？意义是什么呢？既然大家都是在交替领先，秀肌肉啊，我觉得我们就拿 Meta 来说啊，就是你再推一个 SOTA 的 model。只是交一个作业肯定是不够的，他得有个很牛的爆款产品才够的，起码得到 ChatGPT 这种量级吧，才才算爆款。那个因因为这这样才能撑得起 Meta 一千两百亿美金的明年的 Capex 投入，对吧？

你你看 Meta 现在账上现金大概五百亿美金，嗯，明年利润可能六百亿美金，但他明年要投入一千两百亿美金，其实只有一个。Sota model肯定是不够的，对吧？那、那、那包括今天的Sota都是benchmark的Sota，对吧？我觉得那个Gemini三和GPT五点二都是有很大刷分的这个嫌疑的，因为很多模型都是得分很高，但这个低能，对吧？

高分低能，那个其实真的Sota，我觉得应该好的定义是。有多少营收？有多少客户输出多少的 tokens 来定义，而不是 benchmark

的榜单了，就是看有多少人用嘛。之前你在播客上有一个观点是说，嗯，基础模型攫取了价值链的大部分价值。那现在你还是这个观点吗？我觉得还是这个判断吧，就是这里面有一个偷懒的类比，就是基础模型公司就很像，啊，十年前的综合电商平台，你 scale 这个 SKU 的时候，就是模型公司 scale data

这个是更容易的。

你你最后看模型公司想做好哪些能力，就是加数据。你比如说 ChatGPT 也好，Coding 也好，就很像 Amazon 早年卖书一样，它通过卖书拉通了物流、仓储和用户，对吧？那接下来它横向的 scale 更多的 SKU，那。今天领先的模型公司也是，对吧？你看他自己都在努力的做好 Office 里面的 PPT、Excel 数据分析，包括反向投研的，对吧？

其实。基础模型公司他们 scale data 的效率是更高的，那个因为之前 Chat GPT 做 Chat 也好，Coding 也好，其实都都拉通了 full stack 整个 data 的这个 pipeline 也比较好，所以我觉得理解基础模型公司的特点，尤其是他们未来半年模型公司内部的演进的目标，这个是很关键的。

嗯，所以所以今天对投资和创业，我觉得意义很大的一个点就是说，你到底是做的一个。垂直电商还是一个小红书，你你做垂直电商呢，可能也能赚钱，但是要退的很灵活。但是历史上垂直电商没有很大的平台公司的，但是你看小红书是在。综合电商平台之上，又构建出了一层叫消费价值很高的叫叫内容资产，对吧？我觉得这个是很有意义的。

所以今天我们去思考Perplexity也好，思考Cursor也好，对吧？包括一些Agent的公司也好，所以它到底是垂直点上还是小红书？我觉得这个今天还没有答案，大家都在探索期。我觉得这个是比较有意思、值得思考的一个。嗯，现在还太早了。是。今天这个时间点的一部分特殊性在于 Gemini 跃起了，大家会担心那 OpenAI 会怎么办？

它会不会对 Open 有很大的影响？你会怎么看待这两家公司的竞争？对，我觉得这里的核心一个观点就是 Google 加 OpenAI 总市值能到十个 T 以上吧。我对 OpenAI 现在比较乐观，觉觉得被大幅低估了吧？嗯，我觉得有几个原因，嗯，第一呢，就是 OpenAI 可能是过去二十年里面唯一一家有机会挑战 Google 的公司。

啊，微软并其实都没有真的挑战到谷歌。啊，第二呢，Open还是今天当下最好的AI标的。那如果Open你不配置不投，对吧？那那其实其他的风险是更大的。其实Open的人才密度，包括产品的领先性都还是很好的。嗯，那今年两百多亿美金AR，明年四五百亿美金AR，其实你说你说很高的multiple吧，也没有很贵。

嗯。而且第三，Open还是有最高的概率继续立的下一代范式创新，对吧？Online Learning或者下一代的探索还是最领先的。嗯，现在资本市场担心的无非是财务的亏损。我感觉财务亏损这个问题不用过度担心吧，因为过去几十年资本主义国家积累的财富是足够多的。你看今天除了AI还能投啥呢？我估计所有的钱都会砸到AI领域吧。

嗯，我觉得至于 Google 的竞争，我觉得 Google 也不会一家独大吧，因为这个市场也不是一个零和博弈，因为 Chatbot 做了很多增量市场，就很像之前我们比喻的，嗯，短视频，至于这个抖音，至于优酷的竞争，对吧？嗯，我我觉得 Google 和 Open 还是比较好的组合吧，未来在 C 端平分天下，所所以今天我觉得是 Google 短期高估。

Open短期被低估，其实Google这一波因为推了一个Sota model，那个它的估值是从十八九倍的P E变成了一个二十八九倍的P E，其实是一个估值扩张的逻辑，对吧？那我觉得背后的原因还有很多的，就是呃，你比如说GPT和Gemini，他们在模型上拉不开很大差距。假如说假设模型是交替领先的，啊，模型上都无法大赢，那那。

但是GPT是在产品和品牌优势是很强的，但Google有生态优势，对吧？嗯，Open的人才我们感觉还是整体略优于Google的，而且它的产品sense和战略也是更好的。嗯，我觉得还有一个有意思的可以对比的，就是说。ChatGPT过去三年的增速是远超微信当年的。微信是三年的时间可能涨到了四点五亿的MAU，ChatGPT是三年涨到了十四个亿的MAU。

我觉得这是比较厉害的一个数字了，就是说，ChatGPT现在日活，比如四点八到五个亿，对吧？Gemini现在只有九千万，那那它日活大概还是一个五到六倍的关系。我不我们不知道这个最终比例是多少，可能七比三、六比四、五比五还不好说，呃，但还是倾向于判断ChatGPT依然会是长期的。第一，对吧？那最终可能是一个十到二十亿日活的产品，嗯，但但Google的崛起，王者归来还是会压制Open的这个规模或者回报率的。

那个，但这里还有一个很关键的判断，就说。最终的最终，ChatGPT会不会融合传统搜索？最终也会吃掉传统搜索的广告的份额，嗯。但另外一面就是说，传统搜索会融合Chatbot，对吧？嗯，我觉得不排除有一种可能，就是ChatGPT它会形成一套自己全新的搜索引擎，而且这个模型更快，个性化也更好，对吧？而且这些模型生成的内容。

还能被反复利用起来。那那 ChatGPT 的终局，它就是一个信息分发融合的产品。但我觉得说了这么多，就说。不代表Google不好，Google也是好的。那个它有很多好的资产，对吧？Waymo也很好，它还是SpaceX股东，对吧？呃，它还有Animalphig那个要治愈人类所有疾病。我觉得Google包括英伟达可能还是人类最快接近十个T的公司的候选人吧，就是。

十年前大家不敢想象有万亿美金公司，对吧？就像今天不敢想象有十万亿美金公司。我觉得未来有可能有好几家十万亿美金公司。就是其实今天它从三到五万亿涨到十万亿的难度，是远远小于今天市面上比如说几百亿美金的公司涨到千亿美金的难度的。呃，也小于千亿美金公司涨到万亿美金。这个难度，所以所以，嗯，大公司有可能确实会变强，这这是一个，嗯，这可能就是一个我们即将面对的一个一个一个趋势。

但但是今天姑姑是不便宜的，因为刚才说到它那个估值扩张的逻辑。你看Gemini现在有一个SOTA的模型，那外界都觉得Gemini领先了。据你们了解到的实际，它的流量是什么样的呀？有变化吗？嗯。呃，Gemini 三显著在模型上进步，我觉得是好事了。如果如果不进步，反而就更担心了。那个，呃，首先，Gemini 三我觉得对模型的格局是产生了一些影响的，因为 Google 第一次成为明显的骚塔。

但是反映到产品和流量的增速上，呃，Gemini 三这个对 D A U 的拉动甚至还不如当时的 Nano Banana 这个产品拉动的更明显。OK，嗯。其实 Chat GPT 在生活助手它这个这个心智是非常强的。那个很多人是把 Chat GPT 放在手机的首屏上了。我们上一期博客提到，那个其实 Gemini 很多的还是在 Web 端的生产力。

呃，你看 Chat GPT 周末是也在用的。Gemini 很大程度上是周一到周五的工作时间的，叫叫牛马工具。那个比如做前端开发，做做 PPT，嗯。呃，还有数字就是说，Gemini的MAU大概是ChatGPT的。二十到二十五，嗯，但 Gemini 的 D A U 比 M A U 的比例是很低的，只有百分之十。

那个 ChatGPT 的 D A U 比 M A U 的比例大概是百分之二十五。这其实是一个更高频打低频的，那个这就说明单月的绘画的次数，ChatGPT 是 Gemini 也是高三四倍的，然后。还有一些角度，就是说，移动端 Chat GPT 的统治力是非常强的，活跃度是比 Gemini 高非常多的。

因为移动端才是叫生活助理的主战场的，那个，而且你从地域上看，Chat GPT 守住的是。叫最高价值的地区就是北美啊、欧洲啊这些付费能力很强的发达市场，都是 ChatGPT 的这个主战场。我觉得它的商业化的根基是很稳的。那 Gemini 其实是走了农村包围城市的路，就是在巴西、在印度、在越南这些安卓主导的新兴市场，嗯。

呃，在新兴市场，Gemini的渗透率是很高的，MAU可能到了ChatGPT的三分之一左左右吧，所以所以就说从流量的大盘来看，ChatGPT比整个Google搜索从年初的啊九十五比五，现在变成了八十五比十五啊这样的比例了吧，嗯。其实，ChatGPT已经不再是边缘流量了，已经变成一个主流的流量平台了。你看最近Google的表现不错，你觉得根本的原因是什么呀？

你觉得 Google 今天的危机解除了没有？我觉得 Gemini 三肯定是有刷榜的，PR 上肯定有很多工作的。啊，确实是模型上骚特领先了，对吧？那个大家只是不打不把 Google 当 AI 的 loser，呃，诺基亚这种看了，对吧？那个把它当一个 AI winner 了，呃，叙事的反转，对吧？那个我觉得长期危机是没有真正解除的。

啊，未来 Agent 对传统搜索和广告怎么影响？这个还不知道，嗯，那一种情况就是明年 ChatGPT 真的会吃掉很多传统搜索的份额广告，那还有一种情况就是 Google 自我革新，集成 AI，继续做 AI 时代的王者。我觉得这两种走线还是要持续的观察思考的。过去三年，我看到两个范式的演进，分别是预训练和强化学习。

那在今天这个时间点，呃，你看伊利亚说 scaling 结束了，现在进入了研究时代。那之前我们有一期播客也提前预言了 O one 的强化学习的范式。今天你有看到第三个范式没有？有新的这种范式级别的跃迁吗？啊，pre-training的scaling呢确实快结束了，但应该说online learning刚开始。

那那现有的范式啊，那第一个就是pre-training预训练，应该说走到七八十了，对吧？还有空间，但投入很大。那第二个就是RL强化学习。嗯，走到了百分之三十到五十的阶段。那大家今天都在 scale data。嗯，这两条范式下，可能格局不会发生翻天覆地的变化。那头上的几家彼此也都比较清楚，加上。人才流动和信息流动其实都是名牌的竞争了，嗯，其实其实最主要原因还是预训练搞不出更多数据了，对吧？

比如说五六十个T可能也是很多模型公司的一个极限了，而且今天模型的激活参数并没有无限变大，反而是在变小的，而是稀疏度在变高。今天趋势是走向了一个很大的MOE的一个一个架构。嗯，我的感受是，Open也好，SSI也好，Thinking

Machines也好，都看到了下一个范式，都在赌下一个大的范式创新。硅谷现在最热的还是叫 continual learning，嗯，呃，我们很多人叫 online learning，其实就是模型的自主学习，学习效率更高，更少的数据就可以学得更快。

边推理和交互的时候，呃，也在学习，呃，这这个我觉得还是一个最根本性的变革。你看，移动互联网就是交互的过程沉淀数据，呃，今天的大模型还是一个叫静态的。冰冻的没有数据飞轮的产品，对吧？它它没有办法从每天的交互中，啊，吸取足够的信息，对吧？它它需要大量的样本数据才能做预训练，才能学到那个为为就是为什么移动互联网比PC互联网大十倍，对吧？

因为每天的交互交互过程中沉淀了这个互动，吸收了用户偏好。我觉得Online Learning Work以后呢，就说AI。是会吸收人的智能的，就从人类的经验中学习，就是，呃，但但新范式的成熟呢，可能还需要一些基础设施的成熟，比如说更长的 context，对吧？啊，包括 Lora 也也是重要的东西，那。

比如说多个模型的并行采样，嗯，反反正我们还是花了不少时间跟领先的研究员去聊下一个范式。大家都还是比较乐观的吧？应该在二零二六年，比如说夏天或者什么时间能看到突破的一些信号吧？这些新范式主要是由哪些公司在主导呀？谁是其中比较领先的？嗯，Open还是最遥遥领先的嘛，投入最大。其次还是，Illia的SSI、Mirai的Thinking Machines。

嗯，这也还是比较看好 Thinking Machines 的或者其他的 Neolabs 的一个原因吧。我觉得大家都是有一盘自己的大棋的。那个，嗯，其实这比较有意思啊。Anthropic 是 Open 最早的 Scaling 的 team，Ilya 是最早的 Pretrain 的

team。Thinking Machines呢，其实是原班ChatGPT和Post-Train Team，其实这几个团队都很强。

OpenAI即便在分崩离析了三四次以后，依然还很强。那个，嗯。这个 Google 呢，其实今天应该还没有整体 top down 的做 online learning 这些探索，可能可能还是独立的一些研究员在个人探索的角度吧。嗯，哎，我们什么时候能看到 SSI 和 Thinking Machines Lab 的一些比较主要的产品？

我觉得二六年应该能看到一些东西吧。为什么你觉得 online learning 特别重要？我觉得这里有一个暴论啊，就是大家提的机器人世界模型，甚至多模态，其实可能很多是假问题。嗯， online learning 可能才是唯一重要的真问题，就是模型的自主学习，学习效率比较高。嗯，只有这个突破了，其他的问题才是本质上的解决。

嗯，因为这里最重要的还是泛化性，如果不泛化，那后面还是走自动驾驶的老路，就是有多少人工就有多少智能。嗯。所所以有一个很大的概率，就是说，未来机器人世界模型的突破，可能不一定是今天在座的这批人，有可能今天在座的这批人是上一代 L P 一样的结果。这确实是包论。嗯，就机器人最大问题还是不泛化，对吧？那那没泛化，你要像自动驾驶一样，走个十年，一点点的踩数据。

呃，我觉得下一代范是。对现有格局影响是很大的，所所以我觉得理解技术每个季度 review 之前的观点，还是比较重要的吧。你能不能更形象的解释一下这三个范式，从 pretraining 到 RL 再到 online learning？我觉得有三种比喻啊，这个是我们团队内这个提的那个，呃，pre-training呢预训练的数据就像石油化石燃料，量非常大，但总量是有限的，现在已经用了七八成了。

那L强化的。专家数据呢，就是蒸馏的人类专家的数据，嗯，就像新能源，有用但总量比较小，嗯，所以出现了像Serge也好，Mercer这种专门帮招聘人类专家的外包公司，收入也在快速爆发，那。Online Learning有一个比喻，就是叫核聚变，这是核能还没有突破，但如果突破了，就是无敌的，人类就进入硅基时代了。

By the way啊，你觉得一定会出现这个所谓的第三个范式吗？会不会AI的技术跃迁就此终结了呢？我觉得可以从基础设施成熟的角度去理解吧，因为技术在向前发展，可能突破就是一个时间问题。因为过去三年。GPU的出货量，每个研究员手上拥有的算力，研究员的能力和数量都是爆发性成长的，这个就很像好莱坞，整个工业化的创作体系形成了，那持续做出新的作品就是时间问题。

我我觉得是有因果的，那个，嗯，所以这个也是。做这个播客很大的一个意义就是要有 passion 去鼓动中国的科技公司多买卡，给年轻的研究员儿更多的搓卡的机会。就是我们就想，为什么伊利亚诞生在硅谷？因因为硅谷这种大厂很早期就做长期投入，其实没有计算短期的 ROI 的。如果中国大厂多投入、多买卡，培养人才。

那中国的依利亚，下一代的依利亚，那大概率是未来三五年一定会出来的。现在已经有很多年轻的研究员已经有这个苗头了，而且都好年轻，是。我最近聊下来，我觉得大家对于 A G I 的故事似乎都出现了现实性的回归啊。那你作为一直在这个鼓吹 A G I 的人，你今天对于 A G I 有了进一步思考没有啊？你还相信 A G I 吗？

啊，这是比较重要的一个问题啊，就是说我们过去半年，呃，认真花时间研究了给这些 frontier model，嗯，做数据标注的公司，最大的一个体感就是。如果模型数据分布里面没有这类数据，这类任务就是不 work。只有压缩过这类数据，这个任务才 work。就是。嗯，所以你就感觉今天的模型呢，还是一个巨大的压缩器，数据太重要了。

是的，嗯，它都需要很多冷启动的激活数据。嗯，就是其实今天的模型呢，它在知识层面已经超过了绝大多数的人，但是 agent 却没有见过人真实工作的环境，所以就是还要找大量的人类专家。真实工作环境的数据，比如说打印店店员怎么操作 Photoshop 的，对吧？这个销售人员怎么操作 CRM Salesforce 的，对吧？

银行的柜员怎么用系统的？那皮肤科医生怎么看病的？其实都要蒸馏人类金牌级别的专家这些数据，然后在 L 的 training 才让这个 pattern 才能泛化。就你就突然感觉，这很像自动驾驶。A智能要处理的长尾数据量很大，而且解决长尾问题呢需要的时间很久。那个之前大家有句话叫“模型即产品”，但其实后面还有句话叫“数据即模型”。

就是模型级产品、数据级模型，我觉得这个是一个比较强烈的感受。然后，嗯，就关于AGI这个问题啊，我我们听过一个rumor，就是说。Sam最近也在内部说，先忘掉AGI这个。呃，当你过过去一段时间搞明白了模型公司怎么弄数据之后呢，大家都在很大的力气去搞数据。我觉得，嗯，这让我对AGI需要的时间。这个预期肯定是拉长了一些啊。

Agent的落地呢，需要的时间更久一些，但是在局部知识工作者这个群体可能是很快的，比如说coding，对吧？嗯，所以我觉得现实一点的说，就说在知识工作者这个群体局部的实现L三或者L四的体验。是能看得到的，比如说 Chat GPT 做信息获取，对吧？Coding Agent、Office PPT、Excel Agent，对吧？

投研的 Agent，我觉得围绕知识工作者这个群体是能挖出来更多像 Coding 一样的金矿的吧？嗯嗯，所以所以这个结论就是说，局部的 L 三 L 四。确定性非常高，很难整体的到 L 四。嗯，但即便是现有的两个范式，就是预训练和标数据 L 做 L 这些，我觉得有可能也能让 A I 系统比绝大多数的白领知识工作者效率高很多，啊，也是有很高的经济价值的。

但能不能真正意义上吃到那个工资的预算，或者说大规模的解决人类的高价值，这个我觉得是不好说的。嗯，如果这个周期拖得比较久，那就是烧现金流的现金流之战。那如果这样的话，谷歌自己是很有优势的。Meta投入太大了，我觉得不好说。那那就是说，Anthropic 它是一个棋子的价值。嗯，我们相信 Open 还是能融到非常多钱的，因为美国资本比较充裕。

那是不是这些 frontier lab 都要走向垂直，走向分化？我觉得分化会更加明显，在自己的战略 bet 之下，会做到更极致。所以所谓的通用的插包、通用的 agent，它是可能是一个伪命题。我觉得要在通用的能力基础之上做自己的分化，在垂直场景里找价值，在某一类场景里找价值。你比如说 ChatGPT 做朋友，Anthropic 做 coworker coding agent，对吧？

Gemini做多模态的助理，大家都要向下优化各自的数据嘛？那我们来聊聊投资啊，你的主业，其实你现在认知你的投资策略有没有变化？嗯，如果简单的说，就是说。AI的投资就是拜趟技术成长最陡峭的地方，啊，围绕主线嘛。如如果简单的几句话就是说，你应该投全球最领先的两三家模型，这个就很像当年投电商平台，其实不存在小而美的垂直电商，对吧？

第二就是投最领先模型需要的算力和硅基的infra，就就像宁德时代和英伟达。都是依赖一个公司，大家总还是低估这个趋势的大小吧。然后第三就是投最领先模型技术溢出的红利，那那肯定还会有更多的Propensity Cursor对吧，Marker这种这种从技术溢出的夹缝中快速冲到几百亿美金的公司。那往大了说，可能还有拼多多和。

提个头有这种级别的机会，对吧？因为拼多多的本质还是说中国的电商的基础设施非常好了，物流、交通、微信的流量、供应链，对吧？支付这些都成熟了。我觉得AI的基础设施今天正是在走向成熟的这个阶段。嗯，然后我觉得今天的嗯投资策略里面一定要关注几个大的平台，一个是ChatGPT，一个是Google Gemini，还有一个字节，对吧？

还是要理解平台。眼睛的逻辑的平台能做好啥？平台做不好啥？那个，我觉得这几个大的公司再涨个三五倍概率是更大的，而且是简单题。那个，但是平台也有没做好的、有漏洞的一些地方，对吧？那那我觉得这个是比较重要的。嗯，今天这个时间点，我觉得是比较关键的，就是说站在今天。未来三年的Bet到底是啥？所以，所以我觉得通过深度的研究是可以找到爆发性的机会的，就是研究真的可以做的很深，当核心策略的吧。

我我觉得其实很多很多人并没有真的做好Top Down的深入的Focus的研究，嗯。我觉得你是研究型驱动的投资，不是人脉型驱动的投资啊，都重要的，我觉得都重要。那个。嗯，所以回到AGI的这个投资策略呢，你只拜他一家是风险也很大的，最好是投多家，因为大家是交替领先，因为技术变化太快，最好的还是有一个一个一个篮子，我觉得是比较好的。

你因为确实比较难，最终判断哪一家是winner。阶段性我们觉得Azure非常好，对吧？今天我们觉得OpenAI非常好，那个中间有一段时间觉得Google非常好，那个。嗯，对，最好是有一个组合吧。嗯，你现在理想中的AGI的index有变化没有？上一期播客应该是百分之四十的OpenAI加百分之四十的字节，百分之十的Google，百分之十的Anthropic，对吧？

我觉得现在是。百分之二十五的OpenAI，百分之二十五的字节，百分之十的Google，百分之十的Anthropic，再加百分之十的英伟达和台积电，每家都放一些，就是多了英伟达和台积电吧。那个，我觉得你觉得英伟达还没见顶，不能当不能当做投资的这个哦，好，这个不作为投资建议。呃，我觉得英伟达今天是被低估的吧，因为Google起来了嘛。

Google起来了，你觉得因为大家会跟OpenAI，我觉得会交替领先嘛。OK，对。然后另外我觉得还有一个点就是说，你看ChatGPT今天发布刚过了三周年，对吧？那今天要想未来三年。重要的范式和 winner 到底会是什么样的？对，所以我觉得这些 new labs 就是不管 S S I thinking machines 也是应该好好考虑的。

嗯，我们马上就要迈入二零二六年了。作为投资人，你最期待的是什么？你接下来一年愿意投哪些主题啊？我觉得最重要最重要的还是二零二六年，希望看到下一个核弹级别的范式突破。比如说 online learning，对吧？嗯，那如果这个突破了，可能能带来叫更加主动的

agent，这个产品形态也会发生变化。嗯，我觉得还有一个比较重要的就是看到了豆包手机这个例子，就是不知道豆包手机最后会怎么样，但我觉得给了很大的呃启发思考，就是。

叫 Agentic Web，我觉得这才是真正的 Web 三，这个终于有了这样一个 power，让创业公司或者新公司有掀桌子的机会。之前几年是很难的，嗯，这是一个流量短路和极强颠覆性的一个东西，嗯，我觉得二六年围绕知识工作者，嗯，可能是有挺大的，尤其是 coding 吧。嗯，包括多模态进步也会很快，有可能是一个多模态的大年。

那多模态对整个的技术架构也会有，嗯，很大的影响吧。嗯，你刚刚提到那个 agentic web，能不能展开讲讲？嗯，对，就是 agent 如果成为流量入口了，那对今天的 super app、 Google Search 也好，手机厂商也好。嗯，我觉得影响还是很大的。其实是一个流量的终局之战，呃，其实本质是抢的流量的分配权。

如果A阵的真的像做到助理一样，不限量的运转，那那你比如说对Uber、对携程这种公司影响是很大的。其实，其实我觉得是一个颠覆性很强的，以这个掀桌子的这个技术点吧。嗯。你花时间在硅谷比较多啊，能不能给我们讲讲最近弯曲的一些重要的趋势？我我觉得有几个感受吧。第一就是刚才说的啊，模型及产品啊，数据及模型，嗯呃，第二个感受就是。

一横一纵，就是横向的在蒸馏人类专家的知识，纵向的呢又在搞下一代范式，然后硅谷也出现了很多 new labs 新的实验室，嗯，包括硅谷的机器人过去半年进步也不错吧，啊。嗯，待会儿我们也可以聊聊硅谷这些主要的AI公司从上到下的AI二这个年化营收的增长的情况。模型及产品，数据及模型有什么可以展开的吗？嗯，其实你看过去几年，最大的体验的升级，还是来自模型的升级。

模型升级呢，本质都是数据的升级。嗯，就是姑姑之所以多模态强，其实还是弄了很多真实的多模态的数据，对吧？图像各种。Anthropic的coding强，本质还是有最高质量的一个code数据。那Open还更注重的是。呃，模型的性格或者拟人化朋友这些，呃，那你看Sora，其实它更重视mem和传播性，C端很强。

Google的Vo呢，很注重的是创作创作者的这个体验、生产力这。其实其实这些呢，都是在模型训练最初它的数据分布决定的。嗯，我我觉得这里面对创业最大一个建议就是说，除了你要的通用能力，你想做好AI产品或模型产品，一定想。向下的做好数据，你到底有哪些差异化的数据的壁垒？我觉得这个是最关键的。搞数据有没有看到什么新的好的方法？

有多少人工，有多少智能，有多少最高质量的专家，金牌级别的？标注员儿采集这些数据，我觉得这是最关键的。你刚才还说一个观点叫一横一纵，我就想到以前大家会担心 OpenAI 成为一个大一统的入口中心、流流量中心，AGI 时代的唯一的、一个大的入口。今天看应该不可能了，这个是不现实的。我觉得还有这种概率，只是过起来大家觉得。

嗯，它的垄断性不会那么强了吧？而且似乎是有很多级的入口。之前姚胜宇那个观点，世界不是单级的。对，而且手机厂商明年可能也是一个重要的主题吧。一横一纵，能不能展开讲讲？呃，横向就是蒸馏人类专家的知识，横向呢拓宽更多的行业领域吧。嗯，其实这样做呢，有可能AI的上限也挺高的。那个Anthropic就觉得这样做就能到AGI了，超过绝大多数的知识工作者。

那那纵向就是下一代范式嘛，刚才聊的Online Learning，对吧？那纵向突破了，啊，记忆的问题，memory这个问题解决了，边推理边学习，对吧？有交互，甚至有新的硬件，啊，尤其是AI产品更主动，可以always on，对吧？呃，后台帮你准备联想很多东西，嗯，包括交互形态，对吧？那个Chat

GPT今天是必须prompt之后才会回答，不会主动思考，那每次提问它都要从头推理一遍，那那那推理过程中其实还没法学习，嗯。

最近，OpenAI的Mark Chen在有一次访谈中说到，他心中的下一代产品应该是Memory这个记忆能力大幅提升。用户AI会从用户的这个提问中学到用户深层次的问题，这个用户的一些经验。那个下次用户提问的时候，他已经做了很多反思，甚至准备，呃，联想了很多东西。啊，越用会越聪明。那在这种情况下呢，更聪明、更主动的agent，那有可能他也需要他的一个适配的硬件的交互方式。

硅谷最近出现了很多 new labs，嗯，其实不止我们知道的 SSI 和 Thinking Machines Lab，能不能给大家展开讲讲这些 lab

的分布？嗯，对，最领先的肯定还是SSI对吧？伊利亚在做的，然后做模型的自主学习。嗯，这个现有的范式都是预测下一个token对吧？他可能想预测。一个更长的逻辑，那 Thinking Machines 刚才也提了，可能有有有有一盘大棋，然后还有一个 OpenAI 的 Post-Train 的 Lead

Lam 出来做的呃 Periodic Labs 啊，它是做材料大模型，应该说是叫室温超导，嗯，那个 Lam 呢，它是 OpenAI 之前 Post-Train 的 Lead，是 Mirah。

这个 Barrett 他们走了之后，这个 Liam 一度做 post post train 的负责人，然后呃，他另外一个联创是那个 DeepMind 的呃化学模型的负责人。呃，材料大模型其实比医药大模型相比呢，就说材料的实验反馈周期更短，然后模型做 RL 的整个周期是更短的。嗯，但但这个呢，什么时候出结果，其实也看不到。

嗯，还有比如说做 multi agent 方向的 Isara，啊，创始人也是 OpenAI 出来的，ID ID 张，嗯，他是做一个相相当于群体智能，就是训练 multi agent 各种需要的环境，嗯。还有还有Mass and，呃，这个是XAI出来的，然后这个更想是做一个有同理心的模型，这个比较像最早有一个公司叫In Inflation那个方向做的吧。

还有比如说，呃，General Intuition，就是这个是一个世界模型方向比较有意思的一家吧。它以前是一个游戏集锦那种高光的录制平台，说是有三十八亿的游戏片段这个积累的一些数据。然后，那那它跟YouTube这些数据最大的区别就是说。它这些记录的全都都是这个用户在游戏过程中的高光时刻，所以天然的获得了用户，呃标注的这种高质量和操作的反应数据。

嗯，还有一个比较有意思的就是英伟达最近投的Reflection，就是这个像是一个美国版的DeepSeek。因为现在是中国的开源模型充斥了这个美国的各种企业，嗯，这个很多一一批人认为这个不能过度依赖中国的开源模型，所以要扶持一个美国的开源模型，填补这个空白吧。关于机器人，你有什么洞察没有？嗯。一一个是从时间上，过去一段时间都发了很多东西，因为Open的ChatGPT火了之后，很多人出去创业，对吧？

都想做机器人领域的Open啊，比如说派啊、Sunday、Generalist，嗯，我觉得这三家是比较好的。那个，嗯。这个大家都出去创业了一段时间，都陆续发了一些东西。当然，还有做硬件的，包括One X、飞歌这些。嗯，过去半年都是大家集中交作业的时候吧，所以比较热闹。嗯，硅谷的公司比较重视这个能力的上限的突破，嗯，中国公司就更更务实一些。

那个这里面比较关键的一个还是数据，数据还是最重要的，bat或者差异化的所在。你比如说 Google 和派。他们是遥操作的真机数据，Sunday呢，他们是用手套和众包的方式去采数据，嗯，Generalist，他们是用手套采了大量的真机数据，宣称有一个二十七万条的数据吧，说是目前最大的真机数据集，嗯，然后包括也有一些进步，就说。

世界模型和 YouTube 的数据也在成为机器人训练数据的一个重要的来源。嗯，包括也有说这个跨设备的数据马上可以这个 cross 通用了。然后之前大家都还关心机器人的场景用在哪里。那今天，我觉得主要还是两个场景，一个是叠衣服，一个是冲咖啡。但但除了这两个以外，还没有大规模的泛化吧？嗯。然后，啊，另外一个就是大家可能更重视硬件了，甚至有的研究员觉得硬件可能占百分之七八十的成功要素吧。

所以越来越多。算法公司都开始做自己的硬件了。我觉得机器人公司实在是太多了。你最看好哪几家？你觉得哪些是这其中比较值得关注的？我觉得大公司里面最好的还是 Google 跟 Tesla，一个做大脑，一个做本体硬件。创业公司我觉得最好的有三家，一个是派，一个是 Generalist， Pete Andy 他们的公司，嗯，嗯，还有一个是 Sunday，嗯， Tony 子豪他们的公司，嗯。

我觉得派首先是团队非常强，就你就知道它长期的vision是做啥，就是机器人领域的大脑啊，research文化非常好，世界级的。然后最新发布了一个recap强化学习框架，嗯，这个这个核心就是说，它在它可以验证机器人执行任务的鲁棒性，就是。每个步骤都是一分，还有一个模型在打分，就是这一步到底是零点七、零点八分，它可以不断优化。

就它加了 value function 或者这个 credit assignment 这些这些东西，嗯，就像下棋一样，它知道每一步是呃什么是有利于成功的，什么是这个。失败的，我觉得能从成功和失败中学习，我觉得这也是一个挺重要的进步吧。当然，今天的学术属性还更强一些。那个第二个就是 Generalist，呃，也是 Google 出来的团队，他们的口碑和能力都还是非常好的。

那个这个比较重要的是。他们宣称说自己发现了机器人领域的scaling law，有了二十七万条真机，呃，这个数据吧，呃，因为有真机数据呢，它的流畅度和四化性其实比以前也好了非常多。嗯嗯啊，这里的scaling law也比较有意思，这个跟模型参数有关，就是说。这个七B以下，对，如果你增加很多好的数据呢，对效果提升是很有限的。

但你十B的参数以上呢，你增加数据对模型提升效果就就非常好，而且重重要的是可预测了。其实，其实这个我觉得还是一个值得重视的一个信号吧。然后。啊，Sandy呢，他们就改造了那个乌米那个那个那个手用手套的方式，这个就可以低成本大规模的去采很多家庭数据。呃，我觉得他们是比较这个有想象力的，就想直接进家庭做家务。

嗯，这个他们说采的这些数据，这个利用率还能比较高的吧。嗯，包括还有一些公司叫丹娜，呃，我觉得是比较务实的，就是做叠衣服，对吧？然后叠纸巾，希望先把这些场景做好。那个丹娜可能不像另外几家AI research上很酷，但运营能力其实是比较强的。嗯，我觉得。呃，这里还是不能忘了 Google， Google 还是综合能力最强的，得天独厚的一个优势吧。

然后，因为其实背后底层是 Gemini 多模态能力很强。然后，对我觉得大概是这几个名字吧。嗯，它有整体几一个基座模型的优势。是的。机器人现在进步很快，你觉得现在到什么阶段了呢？离所谓的GPT Four时刻还远吗？我觉得离GPT Four还有挺长的距离的。今天可能处于一个GPT零点五到GPT一的时刻，可能未来两三年。

到GPT二到GPT三的时刻，因为今天架构、数据、方法都还没有收敛，嗯，这个跟之前语言模型这个还还是不一样的。语言模型是收很收敛的，大家Pretrain。这个方法和数据都还是比较一致的，这个语言模型是先统一再分化，对吧？机器人是一上来都是分化的，那个。因为因为机器人不像语言模型，还没有一个统一的这些基础，也没有统一的硬件。

那个呃，同时多模态的进步，包括各种人才的涌入，其实每个团队都有自己的 bet。所以今天机器人还是一个百花齐放的状态吧。估计可能在跑一段时间之后，可能技术路线才会收敛，但是场景和方向大家还是有不同的分化和 bet。你你刚才说可以跟我分析一下头部这些公司 A I R 的增长情况，那分析一下吧。嗯，先说一个结论啊，就是说越头部的公司越便宜，越头部的公司越没有 bubble。

其实反而有发布的，可能还是后面的某些公司。然后你你看，我们从上到下往下数，就说OpenAI可能两百到两百一十亿美金，对吧？Anthropic可能九十到一百亿美金。嗯，其中比如说Cloud Code这个产品，可能已经公开都已经这个。十亿美金以上的AR了，Cursor也已经超过十亿美金了。然后数据标注的两家Search AI还有Mocer都超过十亿美金的AR了。

然后Mid Journey的话，我看公开也说七八亿美金，对吧？啊，还有 Together AI 这个做 Serving 的，啊，有个三亿美金，所以这这接下来后面的可能都都都都少于三亿美金了，啊，比如说 Green 企业搜索的可能有两亿两三亿美金，嗯， Rapid 这个 Web Coding 的一个有个两三亿美金，嗯，比较有意思的是声音的那个。

Elevenlabs，它可能有个将近三亿美金的AR，嗯，还有前端建站的这个Lovable，Lovable可能有个两亿多美金了。然后，医生版的 ChatGPT， OpenAI 这个有个一点五亿美金吧。然后还有数字人的 Sensia，然后有个一点五到两亿美金。啊，包括啊 Fireworks AI 有个一两亿美金。

嗯，包括医疗的 Upbridge，这个客服的 Sierra，嗯，其他可能还有一些，比如说 Harvey 可能也一点五到两亿美金，黑镇。嗯，可能也一亿美金以上了。然后回头我们可以贴一个图，贴到那个博客的后面，就是我们整理了一个其他的，可能还有一些，这个包括Minus、Jensberg也都。这个有有一个大概的。

我们之前被说老在聊这些硅谷公司啊，对于国内的这些豆包、千问、元宝、呃 DeepSeek、Kimi、MiniMax、智谱，还包括 Manus，你有什么想说的吗？我们听说豆包已经超过一个多亿的 DAU 了吧？我觉得还是超预期的。嗯。豆包今天的模型完全不代表真实水平，为什么？我感觉人才密度是比较高的，就是可能也是一个模型就改变一个 frontier model 出来，可能又改变所有人对豆包模型的印象了。

很多人说豆包今天模型不够，对不起它的能力，对吧？那那我觉得可以期待一下，二六年豆包新的模型出来。我我觉得这个领先性还是比较强的，嗯，可能二六年是中国，C端Chatbot肯定竞争的一个关键窗口吧。你觉得今年还没有分胜负，对吧？腾讯、阿里肯定会激进的弄呀，对吧？所以二六年肯定大家，我看这个投放啊什么，这个宣传挺多的。

也就这几个大厂卷流量入口了吧，其他呢？我觉得都要有各自的 bet 嘛，就是你看，二五年我觉得很多的独立的模型公司都在学 Anthropic，要么做 coding，在学它，对，嗯，做 coding，啊，或者学 Minus，学 Minus，做

Agent，你觉得可以预见的是模型下一个胜负手是什么呀？我觉得两个吧，一个是产品上端到端的战略的 bet，啊，你比如说 Anthropic bet on coding，给自己找到了一个战略的生态位，对吧？

那 ChatGPT 其实也是端到端 bet C 端的朋友，对吧？那这个体验也比其他的更好一些。那第二个胜负手可能就是下一代范式了，看谁先弄出来。Online learning对吧？更主动 agent，如果模型自主学习 worker 了之后，那最后就是加算力的问题了，它可以跑得很快。中美的AI叙事，你觉得在过去一年有发生过变化吗？

咱们聊聊中美AI产业，你对他们整体的一个体感的差异。就是资本主义只追求叫最极致的东西，对吧？叫资本驱动、数据驱动或者token驱动。那那资本家呢，就只奔着那个金字塔的塔尖去弄了。那这个带来的缺点就是。美国的产业空心化是很严重的，制造业是比较空心化了，这个贫富差距也比较大。其实，其实你就会发现，美国能造出来的东西很少了。

那个，那那以巴菲特为代表的资本家只追求回报率，对吧？那Team

Cook为代表的职业经理人为了迎合资本家，都把制造业转移到中国了。我觉得这是造成产业空心化。很大的一个原因吧，那个，所以你你在湾区待久了就会有一个感觉，美国的制造业就是印钱，印出了无数的美元和美债，那这些美元和美债呢，今天都投到了AI这个方向，所以如果AI成呢，那美国会非常的牛，那如果AI遇到一些卡点，那其实这个短期的挑战肯定还是有的，嗯，所以这个就很像当年的。

美苏争霸，中国就像这个当年的美国一样，猫在后面，那个把美国的 frontier 的零到一去做产业化，所所以你看。嗯，电动车、智能手机、3D打印机、运动相机，很多东西都是硅谷零到一发明的，但是中国能后来居上，占据很大的一个市场份额。嗯，这个我觉得一个很大的原因还是说，呃，硅谷它做出来了。他是主动放出来了，他去追求一个更高阶的创新了。

那那坏处就是产业空心化严重，那个只有一个这个空中楼阁了。所以所以我觉得AI是真的会决定中美未来的战略格局和竞争力的。华人创业者在这一波AI的浪潮中非常的强劲啊！你对他们有哪些建议？我觉得第一要坚定的做全球化市场，尤其是高付费能力的美国市场。美国能贡献收入的百分之六十，利润的百分之七八十。然后第二呢，一定要用好中国的人才工程师红利，不要放弃中国的人才红利和产业优势。

嗯，我觉得淡化身份、淡化地缘，就是做好产品本身嘛。一一定要用好华人的这个人才优势，这个是一个最关键的要素。嗯，而且华人创业者，我觉得要更自信。嗯，不用很别扭的。非要把自己包装成一个海外公司，说我是美国公司，说我是新加坡公司，其实你团队百分百分百都是中国人，对吧？我觉得做好产品就是王道，叫叫自强则万强，对吧？

然后。第三呢，就是说，真的想拿硅谷一线VC的钱，其实是不容易的，因为这个信任链很难。就是比如说你在咱们这个圈子，大家都知道你很牛，都支持你了。那个，那你去给老外证明，有时候比较难证明的，没有这个信任链。我觉得中国VC也是重要力量的，所以其实你在早期发展的时候，这个能拿什么钱，我觉得这个就多拿了。我觉得客观来讲，中国创业者其实做美国市场，嗯，遇遇到的这个困难因素是比，嗯，这个硅谷当地的创业者肯定是更难的，要要克服更多，然后这个身份啊、地缘这些问题，所以搞得我觉得，反正我们也都挺讨厌说那些说不投中国背景团队的那些美国VC，但你没办法，我觉得这个东西。

我觉得就是叫自强则万强，把产品做好，拿产品说话。那你做大了，总有人会帮你解决各种问题。为什么你说希望推动中国有个硅谷？我一度觉得中国有个硅谷，就是中国有个硅谷，这个意味着是一个很多的零到一的创新，对吧？移动支付、二维码、直播、微信、O2O，对吧？其实中国一度零到一的创新是很多的，大家都是很自豪的。那个美国投资人还经常来中国学习。

这这两年。过去四五年少了很多，对吧？我我是二零一一年读大一，那个那一年给我一个很大的触动，就是。电商双十一刚开始起来，那个双十一快递堆满学校门口，我觉得那次给了我很大的震撼。就是后来各种O to O这个跑腿的生意，对吧？后来到红杉做投资，那个你你看到了很多这个中国零到一的创新。我我觉得那时候的创新氛围也是蛮好的。

我觉得这种创新氛围呢，现在只能在硅谷感受到了。这个其实坦白说，过去几年我觉得中国的硅谷，呃，对比美国的硅谷。其实这个差距是有点拉大了，我觉得很大的一个原因是资本的偏激，呃，市场化的民间资本太少了。嗯，我们团队拉了一下，过去三四年里面诞生的AI的应用公司，涨到独角兽的可能有一百多家了。全球，全球，然后。

嗯，做应用的公司里头，中国团队做的，我现在只能想到三五家。我觉得这个比例比互联网时代少太多了，我觉得是非常可惜的。这不包括大模型对吧？不包括大模型，那个。我觉得中国的人才优势还是很强的。这一批九五后、九七、九八的是非常优秀的，嗯，但是很多年轻人呢。零到一的高风险创业创新其实是需要V C的风险资本去投资的，因为这个创新的失败率非常高。

因为V C本身就是一个风险的生意，对吧？那很多创新是从边缘市场冒出来的，那这种就需要风险资本的支持，这个才才能做起来。嗯，我我觉得肯定是希望中国能有比今天多个几十倍甚至几百倍的V C的资本支持各种的创新。这个这样，年轻人的想象力才能被激发出来吧。所以，所以我觉得肯定希望各类资本都更充裕一些，多支持一些年轻有想象力的创业者吧。

你对华人团队的长期有什么期待吗？你觉得三到五年之后，全球最领先的AI公司会是华人团队做的吗？三到五年后，全球最领先的AI公司，如果是，呃，如果是华人背景团队的这个概率，之前可能是。零到五的概率，百分之零到五的概率，现在我觉得到了百分之二十的概率。我不知道听众大家觉得自己内心是一个什么样的概率啊？我觉得这里面核心变量就是，我觉得华人的人才基础非常好，嗯，但是呢，今天只有人才这一个关键要素，呃，此外还是需要。

资本、算力、创新的环境，嗯，另外也要看对最领先的定义怎么定义。如果是规模和营收都是最大，人才竞争力最强，那我觉得有可能是自己。那个，嗯，我觉得希望，我觉得希望未来中国还能有十个自己的这种公司做好全球化的跨国业务吧，营收、技术和人才竞争力。都是比肩甚至超过美国的 Meg Seven 的，嗯，因为 Google Meta 没有中国市场，那那那。

中国公司，你们把中国也做好，全球也做好，那肯定是最好的。也希望未来对中国公司的叙事，包括定价也更好一些吧。好了，今天的节目就是这样。这里是商业访谈录，是一档由语言及世界工作室出品的深度访谈节目。你可以到公众号关注我们的工作室，获取更多的信息。我们的公众号是语言及世界 Language is World。

我们希望和你一起从这里探索新的世界。

127. 大模型季报跨年对谈：和广密预言一场AI War、两大联盟和第三个范式Online Learning · 全文文字稿