他想在太空里面建数据中心,其实很核心的一点是,他不希望有任何政府去监管他。他不只是成为一个最主要的太空经济的一个支持者,他也可以成为未来整个太空经济的一个规则制定方。初创公司是去服务这样的一个数据中心比较好,还是说自己去做数据中心比较好?我觉得这些也是初创企业需要想清楚的。我们去年有五家公司被收购,其中两家就是被英伟达收购的,而这两家云全都是人工智能基础设施的公司。
未来的一个AI应用场景,它会是多种的、多样的一个计算架构完成。这也是为什么英伟达它做了GPU之后,它现在也要考虑说怎么样把它CPU纳入到它整个生态里面。如果CPU还是掌握在别人手里的话呢,它没有办法去整体定义它的一个整机啊、整柜它的一个性能。欢迎收听晚点聊,我是曼奇。这期节目邀请了 Fusion Fund 的创始合伙人张璐,他是 SpaceX 的投资人。
而马斯克刚刚在三月底发布了一个惊人的计划,Terafab 要联合特斯拉、SpaceX 和 XAI 自建史上最大的芯片厂,掌握从设计到制造到部署应用的全栈产能。其中最科幻的部分是马斯克希望把 Terafab 百分之八十的算力部署到太空,建太空 AI 数据中心。他给 Terafab 规划的目标年产能是惊人的一 T 瓦,是目前全球 AI 算力年耗电量的约两百倍。
从马斯克的雄心壮志出发,我们延展聊了太空经济的创业机会和 AI 基础设施领域的变化与新机会,重点讨论了 GTC 英伟达发布背后的一系列整合意图。下面我们就正式进入本期节目吧。今天非常高兴邀请到了老朋友 Fusion Fund 的创始合伙人张璐做客晚点聊。这次播客的背景是 Fusion Fund此前在 AI 基础设施和 AI 加产业模型上有很多布局,陆续都有了一些新的变化和收获。
这包括近期 SpaceX 和 XAI 合并之后,马斯克宣布了新的大动作 Terafab 计划,要建立太空数据中心,以及最近高通也刚刚收购了 Fusion Fund 投资的一家端侧小模型的公司,这背后也有一些 AI 基础设施和 AI 层布局的变化。那我们可以先从。马斯克的新计划Terafab开始聊,这是马斯克刚刚在三月二十一日宣布的。
因为Fusion Fund也是Space X的投资方之一,璐,你可以从你的角度来讲一讲,就是你怎么看这个宏伟的设想的?对,其实我觉得 Terafab 的这个构想,马斯克也不是第一次去提了。很早之前的马斯克其实就已经有提到自己本身是在半导体行业,还有包括整个从底层一直到从芯片层一直到基础设施层再到模型层的一些整体的一个大的生态构建的一个愿景。
所以其实现在大家能看到,在过去这一年时间之内的话呢,很明显的一个差异就是 Google Gemini 它的一个性能提升速度非常快。那在它和 OpenAI
的竞争过程中呢,其中它一个非常大的优势就是因为它有自己全套的全战式的一个技术系统。从自己的芯片层做TPU,再到它的算力,再到它的这个人工智能的模型,再到它的这个数据层等等,这些整个系统之内的话呢,再去做模型的优化,还有包括说算力的部署优化,就会更加容易。
所以从马斯克角度来讲的话呢,他也是一个生态构造者。他也想打造生态,但是呢,一方面他不只是单纯说我想自己做芯片,他更核心的是说我想自己有算力能力,不想被别人去卡住我自己算力未来发展的一个延展的空间,所以他才会有这个想法。当然是一个很宏伟的计划。他也说过说啊,未来大家也不需要在什么 Cloud 里面去做各种各样的实验啊,或者做生产等等。
我觉得很多他的构想的愿景是足够巨大,但具体实施的话呢,硬件层面上的很多创新,它不是那么容易去推进的。所以我觉得可能还会需要一些时间去沉淀,需要一些时间去进行技术整合,但是整体的一个大的生态构想的想法是绝对没有问题的。而且现在,无论是SpaceX的即将上市,还有包括它和xAI的整合之后,再加上Tesla,它未来和SpaceX的整体的一个大的生态整合,都会带来很多巨大的想象空间。
这就不只是一个单纯的说AI生态的整合了,它是想把AI能力和物理世界还有生态整体打成一个大的生态组合拳,然后呢,在这个层面上去做各种层面上的技术应用、技术优化、成本优化等等等等。所以我觉得本身来讲是一个非常伟大的愿景,然后呢,也是有非常巨大的战略价值。但是它的周期还有包括它的投资金额,可能比马斯克自己预想的要多很多。
你怎么看他给这个计划规划的具体的算力啊?因为他自己宣布的是年产能要一太瓦。就是一T瓦AI算力,而且它有一个我觉得大家比较关注的比较科幻的想法,就是它会通过Space X把百分之八十到九十的算力送到太空,嗯,然后在太空中直接用太阳能的问题来解决,就是现在大家讨论也很多的,比如说我电不够了的一些能源瓶颈等等。
三毛特曼也吐槽了,说觉得这个想法挺不切实际的。觉得发到太空的成本很高,以及万一这个集群在太空坏了之后,你想去维修,包括你平时的运维也会很麻烦。对,是的。其实我最近也有很多人问我,其实就马斯克他的太空里面数据中心的这个想法是不是可行,包括说近阶段的一些可行的路线图。我觉得短期来讲的话,确实有很多巨大的问题。
首先的话呢,宇宙里面它有这个。辐射,它这个热辐射,它其实比我们大家想象的对芯片还有包括它整个性能影响要比大家想象的要大很多。但另外一方面的话呢,其实就是我们说的这个成本的问题。这个成本它不单单纯只是说是一个发射成本,当然发射成本SpaceX可以持续优化,还有像您讲的一个运行,还有包括维护的成本。在另外一个基础之上的话呢,其实你还是要考虑说,到底你这个算力是去支持在太空里的人工智能应用,还是地球上的人工智能应用?
当然,在未来的话呢,太空经济、太空生态也会逐渐扩展开。那个时候,我们有很多海量的太空数据,还有包括卫星数据,这些数据都可以成为非常好的垂直领域人工智能应用的。基础,然后每个卫星也可以成为一个小的边缘计算的设备,然后去搭建这些应用。但是这个还是需要一定的时间去把太空的基础设施、太空生态整体的去打开。那如果是在近期你想去搭建,太空里的数据中心去支持地球层面上的AI应用的话呢,除了我们刚才提到这些成本问题,还有一个现实的问题就是延迟的问题、latency的问题,它距离太遥远。
所以其实在技术层面上存在很多很多的可能说还是需要解决的地方,包括之前比如谷歌也有讨论说它的TPU的一个封装,怎么样的封装可以在宇宙辐射这个层面上可以去保护它的性能,这些问题都还没有。解决,所以马斯克的话呢,当然他有这个长线的愿景。我其实个人觉得,他想在太空里面建数据中心,其实很核心的一点是他不希望有任何政府去监管他在太空里面的话呢,没有任何的监管,他有非常大的自由。
但如果单纯你只是说去看能源供给呀,还有包括说啊数据中心冷却的问题,我经常半开玩笑跟我一些朋友讲说,美国旁边就是加拿大呀,加拿大有非常多的水资源,非常丰富的能源资源,同时呢它还有很冷的天气,非常冷的温度。那再加上它又是一个地广人稀,所以非常适合去建造数据中心。如果说你都要去探索在太空里去建数据中心的话,为什么不在邻近的这加拿大可以去建数据中心,去驱动人工智能应用在整个北半大陆?
所以我觉得这个设想的话呢,当然它有它长期的愿景,但我觉得短期层面上的话,还有很多技术层面上的问题、现实成本层面上的问题,还有包括说应用的一个实际效用的问题啊,它可能还需要再考虑一下。嗯,他提出这个想法是不是也和Space X要上市,然后他要给大家更多就是Space X可以做什么的大的未来规划的一些想法和启发了?
这绝对跟他快要上市是有关系的。其实Space X你也能看到,它现在当然是这个行业的霸主,然后它的收入水平也很高。但是大家也听说了,它预期的上市的估值是万亿美金级别的量级,从来没有公司以这么高的价格去上市,所以它也需要比较强的一个愿景去支持它上市的一个价格。或者说,SpaceX所代表的不应该只是一个火箭发射的服务公司,或者说只是Starlink这样的一个卫星的服务的公司。
他希望SpaceX代表的是太空经济,就是Space Economy,整个太空生态、太空经济、太空基础设施。整体的一个市场价值可以在SpaceX的这个市值上面去体现出来。那在这个基础之上,当然就要去延展到很多未来的一些部署。所以我觉得跟这个还是相关的。但另外一方面的话呢,他确实也是一个比较一以贯之的人。
他对很多长线的愿景,可能未来有一天他确实会去做。我觉得,如果有一天我们真的是在太空里面有非常多的人工智能的部署,非常多的这个卫星成为每个边缘计算的一个小的边缘设备的话呢,当我们在太空里的人工智能应用数量足够多,你也需要就近去有这个数据中心去支持。那太空里的数据中心去支持太空领域的人工智能应用,我觉得这个路径是行得通的,而且它的这个 latency 延迟也不会那么严重。
那也希望那个时候的话,我们在应对宇宙辐射啊,还有包括各方面的一个封装层面上,还有包括成本层面上有更好的技术。解决方案。如果在未来的话,太空中可能会有哪些人工智能应用啊?因为比较传统的太空的应用,就大家能想到的可能是卫星发射之后,通信有一些应用,然后遥感有一些应用。这都是存在比较久的。那一些比较新的,可能因为就是比如说Space
X,包括蓝色起源这些公司刺激而来的太空经济里面,有哪些AI可以发挥的地方?
对,其实蛮多的。我觉得第一个我可能想聊的就是太空工厂。太空工厂其实是一个相对来说近期一些我们能够看到非常大的应用场景。那现在我们其实已经有一些公司在去探索太空工厂了。那比如说在地球上,你去合成一些新的材料、新的晶体结构、新的,甚至说在医疗层面上,比如说合成一些新的蛋白质结构,它其实是会受到重力影响的。
咱太空有一个优势就是微重力或无重力。在这个情况之下,你就可以形成非常好的一来是说可能以前没有过的晶体架构,或者说是材料结构,或者说它可以形成非常完美的、很对称的这样的一个晶体结构。这些对于我们,包括你说现在很多的技术瓶颈是卡在材料这一层。或者说是医疗的瓶颈卡在新的这个蛋白质结构层面上,都可以给我们带来很多新的选择的方案。
对于这方面的创新的可能性是非常巨大的。再加上还有一点的话呢,太空领域它是一个天然叫AI native。Robotics native的领域,就是它天然的话呢,就会从底层支持应用人工智能技术和机器人的技术。那在未来搭建太空工厂,那现在我们在地球上讨论一些应用场景,对于人形机器人来讲的话,可能不是那么合适,因为人力还是相对比较便宜的,也更灵活。
但如果是太空工厂的话呢?如果你哪怕有一个相对低的发射成本,你把人类发射到太空之后,你还是要制造一个生态系统,让人可以在那儿存活,而且很健康、很安全。这种生态的一个搭建也是需要很多的技术成本和预先投资的。但如果你发射一个机器人上去,其实你对于它的一些维护啊,还有保持的一些费用就会好很多。所以这是为什么我说太空工厂它天然就是一个AI原生、机器人原生的生态。
那在这个基础之上呢,还有很多其他的七七八八的一些应用。给你举一些我们自己公司的例子,比如说我有家公司,他做的事情很有意思,他是用人工智能管理卫星的交通。因为现在卫星发射越来越多,卫星其实彼此之间也会经常冲撞。那冲撞的话,造成的损失也比较大,而且造成了太空垃圾,对于别的太空设备来讲也是一个潜在的。威胁。
那他们做的就是用人工智能去进行交通管理,但在交通管理的过程中,又可以做卫星数据的一个交易,因为其实大部分的卫星数据是非常高质量、非常有价值的,它不只是做一些太空应用。对于我们就是解决地球上的问题也有很多应用,比如说现在我们有很多公司会看到它用卫星数据去进行,比如说矿产的这种检测呀,然后通过一些卫星数据去提前去检测到山火呀,还有包括通过一些气象数据等等做一些地球端的一些应用,所以这是一个很有意思的应用场景。
我们还有另外一家公司,它建的是太空里的加油站,它是一个机器人系统,可以从月球的土壤上面提取出水,再从水里面提取出氢气和氧气。而这三类呢,其实都是火箭发射和太空飞行中会用到的一些燃料。那与其这样的话呢,未来的火箭发射就不需要,或者说载人飞船不需要搭载那么多的燃料,而是可以去到月球上去进行做了一个加油站的一个概念。
所以,像这种自动化的机器人系统。它其实,在太空间进行通讯啊,AI的应用啊,AI的部署的话呢,也需要呃数据中心的一些支持,或者就是在本地化的一个部署。所以,其实你会发现,它有各种各样有意思的太空经济铺展开的一些应用场景。所以太空生态的成长速度会比大家想象的快很多。这里面有一个我挺好奇的问题,因为刚才你也提到说马斯克想在太空建数据中心,可能还有一个原因是想少一些监管。
那像现在就是他不管是未来想把数据中心发到太空上,还是你们已经投的一些公司在太空的一些活动,它也是占据一定的物理空间的嘛?这个只要是像一一个什么国际协会申请轨道空间就可以吗?就是它是不需要每个国家的这种政府去介入的,还是一个怎样的就是合规的流程?或者说,这个领域其实现在太早期了,它里面有很多地方本身也没有什么流程。
是这样的,当然现在有一些国际组织可以进行一些低轨道的监管,但整体上面的话,就是因为比如说我们有领地的概念,有领空的概念,但是并没有很明确说在太空里面到底是谁去管辖哪一部分。这也是为什么我刚才提到说他在太空里面会觉得他有很大的一个。自由度,而且呢,另外一方面,他其实自己的宏观愿景也比较巨大,就包括你刚才提到他的 Terafab,他不是说要有1太瓦的算力产能吗?
其实这个产能数字是非常夸张的。所以,他呢有这么大的一个愿景,那在特定的区域和国家,他要去做这些事情的话呢,他需要经历的监管层上面的批准,或者说在政治层层面上需要得到的支持是非常巨大的。所以在这个层面上去想,在他在看到说他现在已经成为一个太空经济的这样的一个奠基人,或者说奠基公司的这样的一个位置,他可能也会觉得说,在太空里面他的自由度会更高。
而且呢,他不只是成为一个最主要的太空经济的一个支持者,他可能也可以成为未来整个太空经济的一个规则制定方。那么在这个过程中,成为规则制定方也会给他更大的。一个自由度,嗯,我觉得这应该是马斯克很大的一个雄心壮志哦。包括你刚才提到的,就比如说在月球上去做一些资源开采,然后把它用到呃星际的这些交通啊、燃料上的这种业务。
我也在想,就是这个月球的资源它到底属于谁?可能它谁都不属于。对,所以这也是为什么你看现在美国政府层面上也在加速它的月球计划嘛,还是四月一号嘛就要做NASA的一个下一次发射。然后呢,现在NASA director也比较明确说,三年时间之内不仅要重返月球,而且比较明确是要搭建月球基地。这个其实都是在去探索整个太空经济的。
可能性,然后呢?因为就像你讲的,现在大家没有明确的定义到底属于谁,那所以有点这种先到先得的感觉。包括其实就像轨道。虽然我们说有一些国际组织可以去监管一些轨道,包括前一年也有一些新的监管出来,比如说谁发射上去的卫星,谁就要负责把它拿下来,去降低未来潜在这个太空垃圾的一个数量。但是你有这样的一个条文的之后的话呢,谁去跟进去完成这个监管呢?
这也一个是一个现在的问题。那现在导致就是说,你如果现在发的卫星越多,你这样的轨道越多,那你占住了这个轨道,那别人可能很难去使用。那再加上马斯克,你刚才也问我说他本身做Terafab的他的这个愿景,就像我刚才提到说愿景,它不是一个短期的愿景,他其实有这个想法已经很长时间。他其实就是希望把所有的他的这些各方面的一个技术公司都整合在自己的体系里面,所以它是一个进一步的一个垂直整合。
比如说,它有火箭,对吧?它有卫星,它很多终端,它有机器人,然后呢,再到它现在想把芯片和算力基础设施全都掌握在自己的体系里,所以整体的这个体系就可以堆叠起来一个非常大的,它不只是一个算力工厂。它变成一个怎么说呢?就像它的一个巨大的跨公司的工业操作系统。那最后,它这个工业操作系统就可以不只是给它的公司,比如说
Tesla 或 XAI 供货,而是可以把它所有的叫马斯克的这个生态里面各种各样的多样化的业务绑定在一起。
而核心的这个算力是掌握在自己的手里的,所以这也是为什么他提出了这么大的一个愿景,就是说他要做成一太瓦,因为这个一太瓦的算力产能也不只是现在的即时的一个需求的映射,它是一个终极的一个目标,就是针对他未来,比如说他设想的这个机器人社会呀,自动驾驶的网络呀。整个我刚才提过的整个卫星边缘计算的大的一个生态啊,还有包括更大规模的,比如说像AI推理啊,呃,未来可能在推理层面上的一些需要的算力啊。
所以他是从这个角度去预设说未来的需求是这样的,而这个需求是我整个马斯克生态会所需要的。他希望这样的一个算力需求是掌握在自己的手里。因为每一次马斯克他提出一些大的愿景和想法的时候,其实也会对外界有很多影响,会催生一些新的创业风潮,包括之前的商业航天,还有Optimus带来的人形机器人。对,那像这一次就是Terafab这个计划,你有看到比如说美国有什么相关的这种创业公司、创业机会的出现?
呃,当然,我觉得其实创业机会就是集中在整个AI基础设施的一个创业机会。其实你看,现在大家已经非常明确了,你不能只是去提一个芯片或算力,它其实是一个整个计算系统,包括刚过去的NVIDIA GTC Conference。詹森黄也说得很明确,对吧?现在连 Nvidia 它也不是一个芯片公司了,它是一个 AI 基础设施的一个公司,所以未来 AI 基础设施它就像能源和交通基础设施一样。
它是一个非常明确的护城河,但如果你这个护城河没有抓在手里的话呢,你去单纯靠现买GPU的话,那你的卡脖子的可能性就会非常高。所以,其实他提出 Terafab
的这个愿景,我觉得产业内能看到了很多机会,就是你有了这么大的一个人工智能基础设施的集群。那核心就是怎么样去帮助这个集群变得更加高效。那现在我们会看到很多新的技术,它是针对比如说从单纯的数据中心的成本降低、耗电量降低,还有包括相对应的,比如说
Interconnect,我们最近有一家公司其实跟这个很相关,它就是做下一代的 Interconnect 和 Optical Switch,啊这样的一个技术。
那我们其实提到说人工智能的耗电量,一部分是在训练,还有一大部分实际上是在 communication。包括在传输的过程中,怎么样让帮助它的这个传输和沟通过程中可以更高效,耗电量更低,然后有一个更快速的一个传输,这也是未来大规模人工智能铺设的一个关键的前前提条件。所以,这也是一个新的创新的机会和窗口。
所以我们会看到很多新的基础设施的公司在快速崛起,包括很多VC以前可能单纯就是只是投软件,今年很有意思,我们就发现越来越多的这个大的VC也在看。我们一直是除了企业级人工智能也在投医疗AI,还有包括深科技。那今年会有越来越多的资本走到深科技这一个品类,那其中核心就是要看。Deep Tech
中针对人工智能基础设施的一些创新,我也看到一些就是跟他现在提的这个计划非常直接相关,或者说特别相似的一些创业项目。
比如说,美国有一个公司叫 Star Cloud,对我知道,对他也是做太空计算服务的,对。而且这个公司在华盛顿啊,它都不是在比如说加州那边。是的,是的。其实他最近还在跟我们刚才就是我说做太空里面的加油站那家公司在谈合作,所以它本身现在发展速度也比较快。这部分确实是因为像你提到的马斯克的这个愿景,也推进了很多资本对这方面的一个关注。
但是如果你问我个人来讲的话呢,如果我们就只是讲说。空间太空里面的数据中心,我觉得其实还是有很长的一个距离。就我并不觉得说这是接下来两三年可能实现的事情。哪怕就是说在未来真的有这个需求的话呢,其实轨道里的数据中心它可能还需要,比如说七年甚至十年时间的这样的一个技术周期去实现它技术层面上的成熟度,还有包括它的需求空间。
就像我提到的。整个太空经济打开,太空生态打开,有这样的一个海量的太空AI的应用的需求。这样的话,你在太空里面再去搭建数据中心,也是合情合理的。但现在来讲的话呢,哪怕 SpaceX 的发射成本在逐渐降低,但实际上,如果你发射这么大量级的数据中心,它的发射成本还是非常高的,而且更高的其实是维护成本。维护成本包括你比如说硬件中出现了一些故障之后,你的维修成本,整体的维护成本是非常非常巨大的。
那更不用讲,我刚才提到说现在本身面临的一些现实的一个技术问题。你觉得现在是一个好的时机对创业公司、初创公司来做太空数据中心这样的创业吗?我觉得不是一个好时机,我觉得还是有点太早,可以再看一看。现在我觉得更好的机会是去做AI基础设施,就是整体做AI基础设施整个优化相关的技术都是非常好的机会,无论是硬件还是软件。
另外的话呢,如果想做太空相关的话,就是做太空基础设施。除了数据中心之外,还有很多其他太空基础设施的机会,可以初创企业可以去探索。然后呢,可以去看看接下来三五年整个太空经济、太空生态它的成长速度,基于它的成长速度,再去决定什么时候是一个好的时机,可能去考虑这个。太空里数据中心的这样的一个创新机会,而且呢,数据中心这样的一个大集群的创新机会,它对资本的需求度还是非常高的,它是一个重资本的投入。
那在这个基础上,你就要想说,这是一个机会。那在未来,这个机会到底属于大企业还是小初创企业?那初创公司是去服务这样的一个数据中心比较好,还是说自己去做数据中心比较好?我觉得这些也是初创企业需要想清楚的,自己真真正正的一个创新的机会。嗯,我们可以展开聊一聊近期全球大的科技公司,包括一些新的创业公司在AI基础设施层的一些布局和一些变化。
其实刚才也提到了,就是三月刚好是英伟达刚刚举办了一年一度的GTC。那这次黄仁勋他自己的Kilot演讲也是强调了整个算力的重心是从之前的训练转向了推理,也就是模型的使用阶段。然后GTC上也发了他们新的产品的方案。嗯,呃,这一次很快的整合了。去年底收购的就 Grok 公司的 LPU 的产品,我们可以先围绕英伟达的动作来聊聊。
就是通过 GTC 上的这些发布,包括他去年底一些收购的这种动作,你看到英伟达有哪些在 AI 算力和基础设施上的一些新的想法?对我其实上周也是一直在英伟达GTC,我们一直从一七年开始就和英伟达有比较紧密的合作。然后我也是在周二的时候给了一个talk,就是给他们的Inception Program做了一个演讲,去分享我们现在的创新生态。
其实我们很早就关注到英伟达它在整个人工智能基础设施上面的布局,像比如说我们去年有五家公司被收购,其中两家就是被英伟达收购的,而这两家全全都是人工智能基础设施的公司。而且他们在收购这两家公司之后呢,进行内部整合的速度也很快,马上就上线他们新的,比如说GPU优化的平台、GPU云啊等等。所以其实那个时候我觉得他的愿景就比较清晰了。
那今年的话呢,Jason相当于是做了一个正式的发布。就像我刚才提到的,他对于英伟达现在整个公司的定义,并不是一个做芯片或者做GPU的公司,而是要做全战式的一个人工智能基础设施的公司。所以,他现在核心的一个概念是讲说,就是token economy,对吧?就是token的一个经济,怎么样去扶植和支持接下来这个大的token经济的整个产业的一个崛起。
所以,这其实就是我觉得过去一年英伟达可能比较大的变化。他现在就是要变成一个AI工厂。它并不是说我只要做一个最强的GPU。那除了GPU之外的话呢,它也在加强很多它自己的基础设施的一个能力,像以前的一个CUDA System,对吧?到现在,包括这次的话呢,它可能重点去推的就是一个Vera
Rubin的一个平台,对,包括还有它背后像你刚才提到的整合之后的英伟达的Grok的一个LPX的一个推理的这样的一个平台。
所以它现在呢是想把Grok的一个推理加速能力加入到。它的Mary Robin这个非常大的AI工厂的平台里,而不是单图的去走一条完全平行的一个产品线,所以它是一个很大的一个整合的思维一个理念。呃,同时的话呢,他也希望市场对于英伟达的理解要去转变,因为现在市场对于英伟达的一些判断理解还是说它是一个芯片公司。
但是,杰森是想改变这一点。他卖的并不是一张一块卡或者一个芯片,他卖的是一个完整的系统,对吧?这个系统呢,它不只是有GPU,它有GPU,它有CPU,但它也有网络,它也有存储,它有我们说的其他这个这个CUDA system,还有包括面向agentic AI,还有包括inference的整体的一个部署的方案,这些他都可以去。
提供,而且呢,在英伟达的这今年的一个大会上面,你会发现它已经不是这种单芯片的思维了。前一段我其实我在一个 panel 上还在聊,我说我当时我在学校还读书的时候,因为我以前在斯坦福读书,读的就是材料科学工程,所以芯片其实我的专业对口。那个时候我觉得啊,一个公司一年可以发一到两个芯片已经非常非常快了,再早一点的话可能是好几年发一个芯片。
但今年英伟达是直接发布了七个芯片。而且,基的芯片再加上完整的一个,就是我刚才讲的 interconnect,也就可能翻译成中文应该不是特别准确,可能就是互联,还有包括它一个推理的基础设施的一个组合,所以它是一个全生态的发布,它不是像以前说我发布一个芯片,发布一个产品,它发布的就是一个生态,是一个整个生态的整合和整个生态的一个优化,所以我觉得这点是非常重要的。
另外一个的话呢,我觉得很重要的一个转化,其实前一段我也有在另外一个活动上去分享。包括现在我们就在讲说,为什么 Jensen 他很明确说啊,未来我们的收入会变成多大的量级,然后算力的需求会变成多大的量级。就是因为现在算力的一个重心已经从训练转成了训练加推理。那训练的话呢,我的定义是训练其实算是一个一次性的现金流,就是说你一次性用很多的卡,然后这是它的一个成本和消耗。
但是在未来的话呢,推理在成本上的占比会越来越大,因为我们用推理的次数会越来越多,尤其是现在我们对整个智能体的铺设之后。它在推理层面上的消耗会变成一个持续性的现金流,它是一个持续性的一个消耗。这也是为什么在GTC层面上的话呢,Jensen他会直接说,他对于Blackwell和包括Rubin他在二零二七年他对应的一个数据中心的收入。
他提到了说可能会超过一万亿美元。他这个判断的一个背后核心的前提呢,就是因为未来的这个token的消耗和他这个推理的层面上的一个消耗复杂,会远大于早期一个训练层面上的一个消耗。我记得,其实,在好几年前,我当时和微软的一个人工智能的专家在聊,当时我们就在聊说未来的一个发展。那个时候,可能,比如说,是百分之七十、八十是在训练,百分之十或百分之二十是在推理。
到现在的话,已经逐渐形成了百分之五十五十对半分。那在未来,可能就会变成一个相对倒挂的一个形象,可能百分之二三十。是在训练,但百分之六七十都是在推理,而这个推理还是持续性的。另外一点,我记得当时他还有提到,其实这也是我们自己在看人工智能基础设施一直在看的一个方向呢,就是所有未来AI的产品,包括AI的这个训练AI的部署,它不应该都只有同一种的一个计算架构完成。
就以前的话呢,当然说我们一直的讨论AI的一个底层架构一定是GPU为主导的。但其实像去年我们发布了一个我们自己的行业报告,就人工智能基础设施的一个行业报告。当时我们就已经发现一些新的模型架构,它在CPU上的效率是比GPU上更高。这也是为什么你看这次詹森他也在强调CPU,尤其是在推理的一个语境下,CPU的重要性越来越强。
再加上现在他又会去把那个 Grok 的这个低延时,包括它高速的这个吞吐的推理能力去吸收进来,因为这个 LPU 也是一种新的架构的可能性。那除此之外的话呢,包括你刚才也提到,我们最近有家公司被 Qualcomm 收购,那 Qualcomm 的话一直在针对 NPU 层面上的一些研发,因为低能耗对未来端的 AI 部署,就是 AI 在边缘设备层面上。
的一个部署也是一个非常重要的底层的计算架构,所以在未来的话呢,一方面的话呢,英伟达它有自己一个统一化的一个大的生态平台,但同时的话呢,它也会去承认说未来的一个AI应用场景,它会是多种的多样的一个计算架构完成。那在这样的一个计算架构多样化的一个前提下,对它来讲,不要只是单一的去依附于或者说只是依靠于GPU的这个架构的话呢,就更加重要。
这也是为什么他现在在做更多的这样的一个AI生态的一个布局,包括把自己重新定义成一个AI工厂。所以这些都是内部相互去推进、相互去相连的。对我觉得他有一个就是共同的,从应用层可以看到的变化,就是Agent这个应用带来了很多对推理和模型使用的需求。尤其是像 OpenCLo 从去年底到最近都非常火嘛,还有 Cloud Code、Cloud Co Work 等等。
对,所以这次英伟达确实他也是久违的发了 CPU 的产品,因为他上一个 CPU 是 Grace 系列,那个其实是二一年发的,已经离现在就是很多年了。它 GPU 一直会更新的更快嘛,然后这次 GTC 他发了 Vero CPU,就他的新的这个
CPU。对,而且它的名字是。第一次和他的GPU系列是一样的名字啊,就你能感觉到,就是你刚刚说的它的那种一个统一的平台,然后下面可能有不同的架构的芯片的这种组合的又统一然后又异构的这种生态的感觉,确实是越来越强了。
包括那个Grok的整合,其实我还挺意外的,我觉得它整合的很快的,它其实去年底才收购,对吧?就这个速度还是挺快的,嗯。是,其实你可能也认识一些英伟达的人。我们在英伟达的朋友去聊,其实大家都非常辛苦。像谷歌的话呢,很多做AI的团队都是一周工作七天。然后我在Meta的朋友天天都在war room里面,就是这个战备状态。
然后有些时候工作到凌晨两点,第二天上午七点接着赶,接着起来去工作。就是因为现在整个AI的创新生态在加速,那它未来的这个市场量级当然非常巨大,但它本身的竞争环境还有包括市场的。整个一个不同的玩家的一个位置,可能也在快速的调整。这又是为什么?英伟达它也是有非常强的这种危机意识,对吧?居安思危,所以想去提前去进行布局。
所以他现在呢是想,就像我提到,他想做一个全平台的一个公司。那CPU当然是很重要的一点。他当时发布的时候,我记得他也有很明确的定义。我记得他说的好像是说,是全球首款专门为这个agentic AI还有强化学习去打造的CPU的一个处理器。除了 agentic AI 之外的话呢,另外就是 reinforcement learning 呢,就是强化学习。
其实现在也是比较通用,基本上各个公司都在使用的。所以它的效率,我记得当时他说是传统的这种 CPU 它的两倍速度提升也很多,而且他一开始就宣布了很多的合作客户。嗯,对,而且有中国的公司,因为这个可能没有禁令啊。对,是的,是的,我记得当时好像是有提到阿里巴巴,还有包括字节,对吧?这些都是中国的公司。当然,美国这边的话呢,它合作的重要伙伴之一也包括像 Oracle 啊,还有包括像 Meta。
这就像我们刚才提到的,CPU 确实会越来越重要,因为在就我们提到这个 AI 基础设施里面,尤其是对于推理啊,还有 agentic AI。他们不只是说要把这个我们讲这个token去吐出来,他还需要持续的去调用工具,持续的去运行代码。而且,如果你将来真的你相信AI agent它的一个全产业部署的话,你的agent是总是在活跃的,就你时时都需要它。
这个随时调用的话呢,对于CPU的使用当然就会越来越多。所以这些工作很多,包括还有像我刚才提到的,很多时候还会看到说有多agent的一个协同,对吧?还有包括我提到的 reinforcement learning,还有包括我们可能在很多地方会提到的这个 simulation 的一个流程,这些工作其实很多都离不开 CPU。
所以现在AI就从比如说我们现在可能就单次的去问答一下,用的它的频次也不是很高。但后面可能在A正时代之后,智能体时代之后,就变成一个怎么说持续运行,它又不停的会调用工具,又不停的会调用数据,又不停的会执行不同的这样的一个任务。所以在这个语境下的话,CPU会越来越重要。所以这也是为什么英伟达它做了GPU之后,它现在也要考虑说怎么样把它CPU纳入到它整个生态里面。
而且CPU纳入之后的话呢,对它还有一个好处就是它的平台会更完整。它如果CPU还是掌握在别人手里的话呢,它整个这个服务器的平台它没有办法去整体定义。它的一个整机呀、整柜,它的一个性能,还有一个核心就是从客户的层面上,现在客户在系统集成过程中呢,他的选择就不再是单纯说啊,我从买CPU要买GPU从哪个厂家买,而是说,哎,我要去买整套的一个AI工厂、AI基础设施,那我一站式解决方案,我去找英伟达就可以了。
这样从它的竞争层面上也会更加有优势,所以在这个角度上的话呢,有CPU很重要。即使它的CPU没有这些它的传统竞争对手,比如说AMD做的那么好,当然它现在声称自己是更好的。但即使AMD后来居上,对他来讲这个集成优势也是非常巨大的。哦,我想补充聊聊,就是你开始提到的,去年英伟达收购了两家你们投资的公司,这个我觉得可以展开讲讲。
我觉得也可以给大家一些整个像英伟达这样的龙头企业,它在AI基础设施上的一些思路。嗯,我知道其中一家应该是Laplton AI,对吧?是是的。然后还有一家可以一起讲一讲啊,就比如是为什么原因?对,另外一家就是Nexus Flow。然后这两家其实也都比较巧,两位两家都是非常杰出的华人创始人。然后呢,Lubuntu的创始人叫贾扬清,然后可能很多人在做AI领域都听过他,也是开源生态里面非常杰出的贡献者。
另外一个呢叫焦建涛,也是以前Berkeley很有名的一个人工智能领域的科学家和教授。他做的这个公司,我们也是投完之后的话呢,被英伟达收购。所以这两家公司做的都是人工智能基础设施。具体的细节我可能不太好多去分享,因为其实英伟达和他们那边也有一些要求,对于具体一些整合。但是你能看到说,英伟达其实在动手层面上是很快的,因为这两家公司都不到两年时间。
然后,当然,他们自己本身产品做的也很成熟,在商业化推进做的速度也很快。但在去年年初的时候,英伟达就已经开始和这些公司接触,而且看到非常好的这些产品都可以在自己的生态里面产生巨大的价值,马上就把他们收购进来。收购之后的话呢,整合速度也非常非常快。比如说,Lapton被整合之后的话呢,它就变成了 DGX Lapton Platform。
所以你现在去 Lapton 的一个网站,你会直接看到跳转到英伟达的一个网页。这也是它未来布局 GPU 云的一个非常重要的一个部署。然后去年英伟达最大的收购肯定还是对 Grok 的这个收购,对,据一些报道应该是有花了两百亿美元。我相信资本市场啊,然后创业圈也都是有很多讨论的。这个可能代表了英伟达的什么想法?
包括 Grok 这个公司的背景也可以稍微讲讲。对,这首先的话呢,这个收购它也是做的不是一个典型的传统意义上的这种百分之百股权的收购。他当时达成的,我记得是一个就是非独家的一个技术授权,然后还有一个人才收购。但是核心当然说他是为了收购这家公司,但是呢,他也是为了更快速的把这个交易去完成,做了这样一个特殊的。
一个架构,所以从 Graph 来讲的话呢,我记得它是二零一六年成立的公司。那创始人他本身以前就是谷歌 TPU 项目的一个核心成员。就是 Graph 它一开始并不是是在 GPU 的这个方向去做,它并不是说去优化 GPU 啊,或者说是去呃修补一些 GPU 的一些问题。它其实是从新在去设计一个说它推理的一个计算路径,尤其是强调就是低延迟,还有一个就是高通量,对于 Token 的一个高通量。
所以这两点正好又是现在英伟达它在去搭建整个自己人工智能的基础的是生态人工智能工厂层面上非常需求的一个能力。那Grunk我记得它的一个那个memory的architecture是在速度上是非常有优势的,只是说它这个速度优势呢是局限于特定的一个模型规模。那在这样层面上,它的这个新型的 architecture 在加入到英伟达的平台之后呢,可以给英伟达的很多现有的平台上面的能力进行一个非常好的补充。
所以这并不是说 Grok 进来之后呢,英伟达它的整体战略它有一个变化,它其实继续做的还是 GPU,它会继续用 GPU 再加 CUDA 去保持住它训练和通用的这个推理,就是它的这样的一个大的平台的一个基础能力。但是在这个基础之上呢,它也想把专门的推理加速能力也吸收到自己的体系里,就包括我刚才提到的 Brook,它非常强的这个低延迟,还有包括高的这个 token 通量的这样的一个能力。
那在这个两个整合之后的话呢,这就是为什么它今年可以去推出啊 Vera Rubing 这样的一个平台。这个平台的故事就可以讲圆了。它有 CPU,它有 GPU,它有推理的加速器,它有网络,它有存储。那这些东西加到一起,就是它完整的人工智能的工厂。所以这也是Grack对他的一个价值。呃,其实单纯上来讲,如果你去问我的话呢,他如果只是单纯看他的芯片能力,他可能不值得英伟达付的这个价格。
但是他对英伟达的价值,并不只是单纯的一个芯片产品。它对英伟达的价值其实是补全了它整体生态整体的这样的一个故事线和它的生态层面上各个方面的一个集合的一个能力。英伟达在过去这一年呢,在收购层面上是非常非常活跃的。那不只是英伟达,其实现在芯片能力已经成为了各大科技公司、人工智能公司的一个核心的竞争点。包括我们知道的,大家可能知道其他的一些公司,比如说谷歌已经有自己的TPU的能力了,包括苹果自己的芯片能力也非常强。
那在这个之外的话呢,包括像Meta这样的公司。他们其实现在在芯片层面上的投入也很大,也在这方面做很多的收并购层面上的一个部署,所以你会发现,呃,逐渐的话呢,大家都会意识到,如果你想去。呃,守住自己的技术的这个技术护城河,那你就要有一个全战式的打法。那现在可能市面上有全战式能力的,就是谷歌、英伟达还有苹果。
其实苹果除了自己没有AI模型之外呢,它其他的能力,包括芯片能力,还有包括自己的产品,还有终端等能力,它都是非常完整的。所以大家都逐渐看到,说你作为一个未来的科技霸主,那你一定要有自己全战式的平台的人工智能的一个基础设施的能力。对,还有我们最开始讲的马斯克的布局也是都有,有芯片,有AI模型。是的,对你说的很对。
对,刚才我们也提到马斯克,当然他的构想就更加巨大了。而且马斯克他其实很大的一个优势是在于,其实我们聊很多现在人工智能的公司,它其实还是基于我们这大语言模型,对吧?它是一个语言模型。但我们都知道,现在除了语言模型之后,下一站的话呢是multi啊,multimodal。再下一步的话就是agent的智能体,再往下走的话,其实是世界模型。
那世界模型核心的话呢,不仅需要有模型能力,很重要的一点是需要有高质量的三维世界的一个数据。这一点其实我是非常非常看好马斯克的,因为你想马斯克他整体的生态,它有特斯拉的这样的一个交通的数据,它有特斯拉的一个工厂的三维的一个真实世界的数据,它还有SpaceX所有的工厂,还有包括卫星工厂的一些工程数据,还有卫星数据,还有太空数据。
还有包括未来可能人形机器人,这也是为什么他做机器人是合乎情理的,因为他的机器人的这个核心的世界模型的physical AI的模型的能力会非常强,因为它的数据能力很强,而且它的数据的多样化很强。可能其他的科技公司都没有办法跟他去比拟,在三维世界真实世界的一个数据能力,其他大风公司顶多就是有视频数据,对吧?
但是马斯克他拥有的是三维世界的一个真实数据,那他如果能够把这些数据用起来,去打造他整个的一个AI生态,而且是世界模型的这样的一个AI生态,那他的生态能力可能比我们现在看到这些科技公司生态能力要再提升一个量级。呃,说到就是马斯克整个AI相关的布局,其实有一个和AI
infra基础设施算力无关的题外话,但我觉得大家比较好奇的就是最近XAI有很多人员的动荡,对他最开始找的很多联创都陆续离职了,嗯,对,其实我觉得这个可能反映了两点,一来的话呢,怎么说呢,确实是SAI可能内部它很多模型的能力的提升速度啊是低于马斯克自己的预期的。
所以呢,他的特点就是在于他不怕打脸,这点其实也很厉害的一点,就是他作为一个连续成功创业者,他从来不怕去承认说自己犯了错误,我们要及时调整。就是 done is better than perfect,这是创业经常讲的一件事情。但是这个过程中你可能会犯错,犯错是不是能够及时调整很关键的,因为对他来讲,他从来都不想说去追赶其他模型能力,他想超越其他的模型能力。
所以他的预期相对来讲也比别的公司可能要高很多,呃,团队可能说压力也比较大,所以这是第一点。第二点的话呢,马斯克的一个个人的性格特征就不在于他是非常明确说,当他看中这个人才的时候,他想招聘你,他招聘的能力非常强。我认识很多人,包括我认识他们其中的一个联创,马斯克其实找他找了三年,就不停的去找他。说服他,然后他当时其实先是在读书读PhD,后面的话自己本来创业要做公司的。
跟他聊得差不多了,有一天跟我讲说,我终于被马斯克说服了,我要去加入xAI。所以其实他的这种对人才的这个追求的能力是非常强的,而且他确实有巨大的愿景。也可以去说服这些人才去加入他,而且包括像XAI,我当时认识他们这些联创朋友,有些人跟我讲说,经常在公司待到凌晨五六点,为什么?因为马斯克可能凌晨一两点进来,跟他们去一起头脑风暴,去探索怎么样做这个产品。
那他自己本身的工作强度是非常巨大的,那又带动了整个团队工作强度很大。投入也很大,大家都长期处在一个高压又打鸡血的状态,所以这是一方面。但另外一方面,当他发现有错误之后,他做决策的速度也非常快,他也是不太留情面的,他不太会说啊,你跟了我这么长时间,我会觉得说,哎,我们要再去调整一下。他觉得不行,他马上做调整。
所以呢,就是可能说不能以通常的这种人性或者说我们说的这种EQ啊情感去判断的这样的一个做事风格。也可能是造就了他这样的一个高速、快速的创业者的风格吧。我也不知道怎么去评价吧。包括我认识很多跟马斯克合作的人,我觉得可能有一个词非常好的形容他,就是一个很有魅力的暴君。一方面,你又觉得他是一个暴君,但另外一方面,他又很有魅力,他有非常巨大的愿景。
他确实时时刻刻也有自己非常明确的啊,就是未来的愿景要去改变世界的一些非常强的内驱力和动力。但在这个过程中的话呢,他会觉得这个愿景是最重要的,这个目标是最重要的。那其他的一些决策,还有包括得失,还有包括牺牲,都是值得的,或者说都不是他的优先级去考虑。我觉得xAI就是经过他这一次有很多人员的汰换之后,接下来会怎么发展,是整个AI领域或者说关注马斯克整个生态的这种实现的人可以去关注的一个话题。
对对,反正我也跟一些做AI的人聊,就有的人现在就对xAI有点悲观啊,就觉得其实之前走的那些人还是挺强的。对,我觉得其实也不需要悲观,因为xAI它现在和SpaceX merge之后的话,再加上它在整个马斯克的生态里面,它能够调用到的资源还是非常夸张的。你很难说能有另外一家公司可以像xAI这样作为一个所谓的初创企业调用到这么多的资源。
而且呢,他们在人才层面上也可以直接用到,比如说特斯拉那边的人才,还有包括SpaceX那边的人才。其实,在内部他们的人才的一个流动,还有包括资源的流动效率是非常高的。所以,我觉得XAI现在已经正式作为SpaceX的一部分了。那它就不再是一个单独的公司了,未来它也会和SpaceX一起去获得到我们刚才提到即将到来这个巨大的太空经济的趋势的一个托举,它会有一个加速的一个过程,因为乘势而为嘛。
那再加上另外一方面我提到的他们的一个数据优势,比如说能拿到真实世界的数据,包括未来可以拿到的卫星数据、太空数据,这些都是它巨大的一个潜在的优势。前面说到就是英伟达的这个全栈的布局,包括其他大公司也都认识到要做比较深的垂直整合。那有一个相关的话题,这个在美国应该也讨论的比较多,就是TPU和英伟达的GPU。
就Google的TPU现在也被认为有很强的竞争力。是的,可以讲讲就你观察到的Google最近在AI算力在基础设施这块的一些动作和变化吗?对,谷歌其实它在TPU的投资也是做了很长时间了,一定是超过十年的一个周期了。这也就证明说,谷歌它其实并不是最近才意识到了推理的重要性,它其实是已经在很早就意识到了推理的重要性,而且已经沿着TPU这条线做了非常多年的。
一个积累,所以这点是非常非常重要的。那再回到说它TPU本身的一个能力,我觉得它最大能力体现其实还是在谷歌的生态里面,因为TPU它本身的一个优化都是基于谷歌它整体的这个全栈式的一个优化,补全了整个谷歌它现在从芯片层到模型层到自己的数据层,再到它有很多的现金流,对吧?还有很多的这个应用场景和现实世界的反馈,它也打造自己的一个非常好的生态。
但是,如果你把TPU给到第三方去用,当然现在谷歌也开始把TPU提供给第三方去用,你会发现它的呃芯片能力其实没有在谷歌内部用的那么好。其实还是回到我们刚才提到的,它整个这个系统优化的一个重要性。像谷歌自己用TPU,他们其实不仅是说性能非常好,成本也非常低。我记得它现在整个的training的cost应该只有OpenAI ChatGPT的三分之一左右,就是因为它可以做非常好的系统优化。
这个系统优化呢,就可以保证它进行成本优化,在TPU的这样的一个基础之上。但是如果我是第三方的公司,我去用谷歌的TPU,我并没有谷歌那一套整体的系统。我并不能做到那么好的系统优化,所以在性能上和成本层面上都会打一个折扣。这也是为什么。虽然说资本市场他会可能有很多的这种讨论,说TPU去占领GPU的市场,我觉得短期来讲的话呢,还是很难对GPU形成一个有效的威胁,而且呢,未来的市场会越来越巨大。
现在只是AI整体的产业部署,还有包括产业整合的一个开始段。那我们现在可能看到大的这些行业,金融、医疗、保险,它AI的整合可能连百分之一都不到。真的大规模的铺展开了之后,对于算力的需求是非常非常巨大的。如果那时候单靠一家GPU,单靠一个这个计算架构去支持,也不太现实。所以,我们未来是能够看到说市场需要多样化的计算架构。
那除了英伟达之外的话,其他公司也可以提供各种各样不同的解决方案,可能才会让我们有足够的算力基础去支持大规模的人工智能的一个铺设。嗯,对你刚刚说到,就是TPU,它可能别的第三方公司用起来会有一些难度。这个我们之前有另一期节目聊到过这个事情,就里面有两个嘉宾是从Google出来创业的人,嗯,然后他们就是讲到谷歌内部,因为他们自己也做JAX,就这些类似于像CUDA这种软件系统嘛,他们确实自己会用的比较好。
呃,有一个事儿可能会让TPU逐渐的扩散,就是Google其实会支持很多从Google出来创业的人来用Google的TPU的这套方案,就是从芯片到系统层。对,包括他们当时也提到说,其实马斯克XAI之前那波人,他们对Google的芯片就会比较了解,因为有一些可能有Google背景的人,所以他们用Google的那套系统也比较熟,嗯。
是的,是的,其实核心就像你说,那谷歌如果也有一个他们自己的 CUDA System 去支持 TPU 的这样的一个使用,那从开发者角度层面上的话,使用起来就会更加方便了。但是呢,在这个基础之上,这也是为什为什么英伟达现在它不只有 CUDA System,对吧?它要做更加全站式、全平台的各个方方面面,帮助开发者在它的平台上进行各方面的服务和整合。
这样的话呢,你对它平台的依赖性就会更高,也就很难再去迁移到其他的这个计算架构平台上面去了。嗯,那最后一部分我们可以稍微延展一下,就是从基础设施到应用的一个变化。因为请到路来做个节目,我是想让你分享一下你们对B to B就企业市场的一些观察。嗯,因为C端的AI市场其实全球的信息会更通畅一些嘛,大家也能看到一些很明显的热点,比如说像Open Clow这样的个人agent。
然后 Fusion Fund 自己是,呃,很关注整个企业对 AI 的使用的。比如说,你现在就最近一段时间,你看到的这种具体的行业和 AI 结合的一些变化是什么?包括你们比如说投的一些公司,可能它也服务了一些具体的客户。这个里面有一些什么之前没有出现,但现在看起来会加速的一些迹象。今年确实是 Enterprise AI 就企业级人工智能非常非常好的。
一年,不只是说技术层面上的一个创新,还有发展,还有包括整个产业整合的速度也非常的高。然后的话呢,从企业级人工智能来讲的话呢,我们其实看到,先说几个大的趋势,就是首先的话,今年可能有一些共识是在业内形成了。第一个共识呢,其实就是大的企业不只是科技公司,大的产业都愿意去进行人工智能的垂直领域的部署,而这个部署是基于小语言模型,而不是大语言模型。
因为很多行业,包括我们提到的金融、医疗、保险,他们其实都是高监管行业,数据也比较敏感,所以在这个基础之上的话呢,他们更需要的是,希望无论是AI应用或者是Agent,它可以在本地化部署。或者是在它这个私有云去部署,那在这个基础之上,它可能对于特定应用场景的需求,比如说它的延迟性层面上的需求,还有包括对它的一个准确性不能有幻觉的需求。
都让很多这种垂直领域的人工智能的应用,它的铺设速度会更快。再加上,因为它一般都是小语言模型的话呢,它不需要让客户把所有的数据都传到云端,所以在数据隐私层面上有更好的保障,而且在成本层面上也更加优化。因为是小语言模型,所以你的算力的消耗、电力的消耗都相对来说更加的优化。所以,在这个层面上呢,我们就会看到说,对于这种垂直领域小言模型的整合的速度是越来越快。
二来的话呢,其实我从一月份就感受到,我当时在达沃斯和很多大的企业的这个CEO去聊,甚至他们董事会去聊,大企业的焦虑感现在非常重。大家都意识到说,我们有海量的数据,但我们这个数据怎么样能让它变成数据资产的核心呢?就是要去和AI进行整合,否则的话,你有一堆数据,但它并不是一个真正的数据资产。那一方面要去做,比如说这个数据的一些优化,我们叫data curation。
然后再去搭建一些安全层啊、数据隐私层的一个中间层,在这个基础之上,就可以进行各种各样的人工智能的应用的一个整合。所以现在我们会发现,像我们从一八年开始就是有自己的一个网络,叫CXO网络,里面大概有四十五个全球一千强企业的CTO。今年我们听到普遍的反馈是,他们手里的预算都越来越高。最多的一个跟我讲,他手里有一百二十亿美金的预算,都是用来做人工智能技术相关的收购啊、技术整合呀,还有包括订单、战略合作等等,这个都是比较大的转向。
那这些CTO或者首席人工智能官的,他手里的预算增加之后的话呢,不仅是会加大大企业在人工智能层面上的投资和部署,也会加快人工智能的一个整合。所以我们会看到很多金融公司啊、保险公司,它可以在三四个月就完成一些新的人工智能技术的整合,这也是我们看到的巨大机会。那当然,这是两个一个整体的一个共识。那回到说你说具体的行业的机会,一方面,我觉得我非常看的好的一个方向就是人工智能在医疗领域的应用。
你也知道,我一直对医疗领域非常有热情。我们一七年就发布了人工智能医疗领域的行业报告,去年又做了它的二点零的版本。今年像年初的话呢,也能看到一个比较大的信号,比如说,意大利里里来他和英伟达达成了一个几十亿美金的战略合作,专门去推进人工智能公司和制药领域的一些合作,还有包括人工智能和应用场景的一个铺设。
同时的话,你看到 ChatGPT 和 Cloud,包括 Transformer,他们都发布了人工智能在医疗领域专属的这样的一个应用的产品。就是大家发现了医疗领域不只是有巨大的市场量级,美国 GDP 的百分之二十,它也有海量的高质量的数据,而且还有多样化的应用场景,这些都是在人工智能应用层面上非常非常关键的。
所以在这个基础之上的话呢,我们就会看到很多很好的高质量的数据在医疗领域被应用到垂直的AI应用的产品的这样的一个发布。那在这个基础之上,你会看到说高质量的数据就可以更加的有助于小语言模型的搭建,还有包括部署。同时呢,我们有看到很多的医疗机构开始使用联邦学习(Federated Learning)这样的话呢,在监管层面上他们也不用担心数据隐私的问题。
所以相对应的思维理念呢,也在金融行业、保险行业有比较明确的体现。所以我们会看到金融、医疗、保险这三个行业发展的速度,尤其在 AI 整合的速度上,可能是最快的。在这个基础之上,还有包括物流供应链一些传统行业的话,它在大规模的一个铺设。另外一个方向,当然大家都在聊的一个方向就是机器人,对吧?Physical AI 物理 AI。
这个方向它整个发展速度也非常快,但是我是觉得说,在本身 physical AI 层面上的话呢,也要看的一些产业应用,可能工业和供应链层面上的话呢,应用会走的速度快一些。那在这个之后的话呢,太空领域也是非常好的一个领域。我刚才提到太空本身,它就是 AI 原生,机器人原生的。那我们在过去十年、十一年,就像你说了,我们一直关注的都是企业级应用,都是B to B,我们没有看过consumer端C端。
那现在也会发现说,人工智能的整个大的市场应用市场呢,你做C端应用确实有点困难,因为你的竞争对手都太强大了。但B端应用的好处是,传统行业的这些大公司,它反而不愿意把公司内部的核心数据分享给大的科技企业。他也不愿意把大量的这个核心数据上传到云端,所以在这样的一个考量的一个语境下呢,他就会更愿意和初创企业合作,反而会让很多初创企业可以加速他们垂直领域应用的快速的迭代和发展。
所以,我们今年会看到很多这种做垂直AI的To B的部署的公司,它的收入成长速度是非常非常惊人的。我们有很多公司一年时间收入从零涨到两千万美金,团队可能还不到十个人。所以,在美国现在做To B的企业级AI是一个非常好的时机,也是非常快速发展的一个时期。我觉得中美在这个创业上的一个差异,却是中国的很多创业还是会想做就是偏互联网和移动互联网的这种消费用户的市场。
嗯,美国我觉得有很多创业,它是非常聚焦于在企业级市场。这个可能还是跟整个退出环境都是有关系的,对,是的。反正两边市场确实不太一样。我觉得美国它其实,包括你现在其实看到硅谷,我也多说一句,在硅谷做人工智能的这些顶尖的创业者,其实很有意思。他们的背景基本上都是移民。比如说亚裔比较多,亚裔可能是最多的。然后像呃欧洲裔、加拿大裔、以色列裔,可能最下面才是所谓的土生土长的美国人。
所以你会发现很有意思,就是全球的很多人工智能人才都聚集到了硅谷或者说美国这个大市场来做。为什么呢?就是因为我刚才说的这些To
B的机会。他们在这边,他可能他的员工或者说他的工程师团队还留在比如说加拿大、欧洲,但是他如果想去做进入市场商业化,那这边可能是最快速的一个市场。就包括像我们合作的很多大的这种CTO,比如说像呃,我们有很多公司都和JP Morgan
Chase合作,也是美国最大的银行,他们的首席人工智能呃官就是Chief AI Officer,也在我们的网络里。
那他们现在就美国最大的,可能也是最传统的一家银行,呃,他们现在在人工智能技术层面上的迭代和整合是非常惊人的,速度也是非常快的。所以你就会看到这些传统行业的龙头企业,它在加速人工智能整合。还有包括像可能大家听过的像柯氏工业,柯氏工业也是美国老牌企业,它的不是上市,它是呃私营企业里面可能最大量级的企业之一,它也是共和党比较大的金主,这点可能是大家知道比较多的。
他们作为私营企业的话呢,它的灵活度更大。它有一个叫KDT,就是柯氏的叫Coke Destructive Technology这样的一个部门。专门引进一些新型的人工智能技术解决方案,给他们下面控股的所有这些大型企业去应用。它的这种合作周期是可以非常快速,一两个月的时间。所以你看到这些传统行业的龙头企业在加速进行人工智能整合,你就能理解为什么全球很多做人工智能创新的创业者愿意来到这个市场。
因为它的商业化的速度会非常快速。那在商业化的基础之上,我们刚才又提到了,像我们去年有五家公司被收购,收购方就包括像英伟达这样的大企业,它有很多样的推出渠道。公司不只可以说去IPO,IPO毕竟可能需要七年甚至十年的时间。那收并购的话,我们去年五家被收购的公司,四家都不到两年时间,那给我们带来的收益也是十倍、二十倍的。
当然,我也希望它可以做得更大,它可以有更高的这样的一个回报的倍数。但是,这样的一个短平快的退出机制也促进了人才的流动和资金的流动,所以这也是它市场的一个非常大的优势。嗯,而且我觉得他创造了很多就是有经验的,而且有底气的连续创业者。其实 OpenAI 最开始大家也会总结他是蓝血创业嘛,就是大家并不是说为了财富去创业,他们已经过了那个阶段了。
对你说的其实也很对,其实,在硅谷这边的连续成功创业者这个族群也是越来越大。我自己也是连续成功创业者出身,我们其实从一五年。我创始 Fusion Fund
的时候呢,搭建的第一个生态就是叫超级创始人网络。我们这网络里面有六十二个人,每个人都是连续成功创业者。就像你讲的,大部分人已经财富自由了。所以他在去探索自己下一家公司的时候呢,不只是单纯说财富收益或者说自己的一个财务回报,更重要的是要改变产业、改变世界。
所以我其实觉得,我之前也在很多其他的采访的时候会提到,我觉得在这边做早期投资其实也是一件比较幸福的事情。我自己本身是有点理想主义在里边的,就是经常相信这句话:改变世界的同时创造财富,但最重要的是改变世界。但你就确实可以从这些人去成功创业者身上看到这样的一个信仰和信念,他们做很多新的创新的探索,核心目的是为了改变产业、改变世界。
那这样的一个原动力呢,也会帮助他们吸引到更多的人才,也会帮助他们去进行更快速的一个创新的探索,也会帮助他们在。去做各种各样的决定的时候,更多的是看长远的,呃,对于公司的一个优势的考虑,而不是短期的一个财务回报。我觉得这点也非常重要。那可能最大的一个代表就是马斯克,对吧?他是最典型的连续成功创业者。虽然他现在是全世界的首富,但如果你看他日常的生活的节奏,他生活的条件,你可能不想过他的日子,也不想过他的生活。
前一段不是他的妈妈也发布了,我记得是发了一个推特或怎么样,就讲说他去看马斯克,其实睡的地方就是一个气垫床,他也没有非常好的一个生活条件,也没有很多的一个个人生活的一个享受。我觉得还是一个使命驱动型的连续成功创业者的一个思维理念。最后一个问题了,就接下来一段时间,比如说接下来一个季度或者半年吧,你自己会计划花最多精力来做什么事情?
嗯,其实我会聚焦,当然还是说投资。我们其实去年也年初就发布我们的新的第四期基金,所以从去年到现在也是在非常紧张的。快速的非常打鸡血的状态,在和很多初创企业去合作。去年我们投了十家企业,今年可能还会投七到十家企业。所以看项目,然后管项目,可能是我会花时间最多的地方。包括我们今年会有三家公司上市,所以在公司准备上市的过程中,也要有很多我们作为董事会成员,作为它的早。
投资人对他的很多支持和辅助,这个层面上当然会花很多精力。但是如果你问我说自己对于这个技术方向,还有包括产业的一个热情的话呢?当然这三个方向我都看,就企业级人工智能、医疗AI,还有包括工业自动化。但是如果细分来讲的话呢,我个人会比较感兴趣去多花时间的一个是人工智能基础设施相关的一些创新,尤其是这些技术可以去解决 AI infrastructure 它下一阶段的一些瓶颈。
比如说它的瓶颈,它不只只是模型了,它的瓶颈其实是比如说 inference cost。比如说它的这个能源层面上的瓶颈,它的memory层面上的瓶颈,security,还有包括系统整合,这些都是我非常看好的技术方向,会去花很多时间。另外的话呢,就是我刚才提到我非常看好的医疗AI。人工智能在生命科学在医疗领域的应用,这不只是软件层面上的应用。
像去年我们投了两家公司,都是机器人在医疗领域的应用,一个是做整个传统的制药和生命科学行业的机器人自动化,这个公司发展的也非常快,叫Medra。另外一家呢是做这个微型机器人,就微观机器人或者说纳米机器人层面上的应用,这也是我非常看好的一个方向。最后的话呢,我可能还是会持续保持我对太空科技的热情,太空领域的整个太空经济的快速迭代发展,还有包括整个太空经济的未来巨大的量级。
我觉得未来两三年都是非常好的投资机会。我自己本身从小就有对太空出使的这样的一个热情,还有自己的原生的对创新的一个巨大的动力,所以呢,我可能也会在这方面花更多的时间。嗯,OK,今天非常感谢 Fusion Fund 的张璐做客晚点聊。我们从马斯克的 Terafab 开始聊,然后也聊到了包括英伟达、Google 这些大的公司在 AI 算力、AI 基础设施上的布局思路,还有一些新的变化。
然后最后我们也聊到了整个 AI 和产业结合在企业级市场带来的价值和未来的一些趋势。那今天节目就到这里,谢谢各位的收听,大家拜拜。本期连点呈现推荐一百一十五期节目,我与模型智能创始人徐林杰聊AI算力和基础设施。当时我们的切入点是华为在二零二五年四月发布的Cloud Matrix三八四超节点AI集群,这是由三百八十四块华为升腾九幺零芯片互联而成的。
那期节目里比较详细的拆解了算力底层的构成,不止GPU,还有互联技术、网络、冷却等综合系统。结合GTC三月的新发布,我们可以看到英伟达自己也纳入了更多异构芯片,也就是不同架构的芯片,即我们这期聊到的。他整合了收购的公司 Grock 的 LPU,以及他自己新推出的 CPU。从这两期节目里,我们可以看到,在整个算力底座的竞争上,大公司还是有新团队难以撼动的长期积累。
这和应用层已经出现一人或几人的小团队估值就可以达到数亿美元的公司的情况非常不一样。所以现在有两种非常有意思的组织方向。一个就是我们这期聊到的特斯拉和英伟达,他们都是越来越超级垂直整合的巨无霸。另一种就是很多个人开发者,或者说新的小团队,他们以小博大,几个人就做出了非常有影响力的产品。典型的是 Peter Steinberg 作为一个个人开发者,做了 OpenCL。
可以预期的相对确定的创业机会,就是以这种小团队的方式做一些产品或者应用,然后被大的团队吸收。比如 Peter 在 OpenCL 火了之后,很快的加入 OpenAI。即使在芯片领域,像 Grok 这种公司,它被英伟达收购时,其实人也不多,大概就两百人,两百亿美元对应到两百人,相当于一个人就值一亿美元。
我们这期聊到的很多创业机会都属于这一类,比如张璐提到他们自己投资的公司里,去年有五家被收购,其中几家成立的时间都不到两年。当然,市场也更期待撼动格局的新的传奇和大独角兽出现,在应用层、AI infra层或者一些新的智能方向上,如巨声和世界模型。我们可以看看之后会不会有这样的新公司。本期节目就到这里,感谢收听。
如果你对今天聊的话题有观察、好奇或疑问,欢迎在评论区分享想法,这也会成为我们节目的一部分,让整个讨论更完整。你也可以把我们的节目分享给对这个话题感兴趣的朋友,推荐更多你想听的主题和嘉宾。你可以从小宇宙、苹果Podcast等渠道关注“晚点聊Late Talk”,也欢迎关注我们的公众号“晚点Late Post”。
下期再见。