马斯克的Terafab愿景:全栈控制与去监管化

马斯克于2024年3月21日宣布的Terafab计划,目标是联合特斯拉、SpaceX和XAI共建史上最大的芯片制造与部署生态,覆盖从设计、制造到部署应用的全栈AI算力能力。其中最具颠覆性的构想是:将Terafab约80%的算力部署于太空,建设太空AI数据中心,年产能目标高达1太瓦(TWh)——约为当前全球AI算力年耗电量的200倍。这一计划远不止技术层面的野心,更深层的动因在于摆脱地缘政治与政府监管的束缚。正如Fusion Fund创始合伙人张璐所指出的:

他想在太空里面建数据中心,其实很核心的一点是,他不希望有任何政府去监管他。

在张璐看来,马斯克本质上是一位生态构造者,其目标不仅是自研芯片,更是掌控从底层算力到上层模型的完整系统定义权。这与英伟达近年重拾CPU、整合全栈能力的战略高度一致——若CPU仍受制于他人,就无法对整机、整柜的性能进行全局优化。Terafab的提出,也恰逢SpaceX临近IPO之际,其万亿级估值预期亟需一个超越“火箭发射公司”或“星链服务商”的宏大叙事支撑:SpaceX应代表整个太空经济(Space Economy)的系统性价值

他不只是成为一个最主要的太空经济的一个支持者,他也可以成为未来整个太空经济的一个规则制定方。

太空数据中心:愿景与现实的鸿沟

尽管愿景宏大,但将数据中心送入太空在短期内仍面临多重严峻挑战。张璐指出,宇宙辐射对芯片性能的影响远超预期,而热管理、辐射防护、模块封装等硬件问题尚未有成熟解决方案——即便谷歌也曾探讨TPU在轨抗辐射封装,但至今无公开突破。此外,发射成本、在轨运维难度与故障修复成本构成三重现实瓶颈。三毛特曼(Gurbaksh Chahal)就曾公开质疑该构想“不切实际”。

更关键的是延迟(latency)问题:若太空数据中心服务地球端AI应用,数百公里乃至更远的距离将导致毫秒级延迟,难以满足实时推理需求。张璐半开玩笑地指出,与其冒险上天,不如就近选址——加拿大拥有丰富水电、极寒气候与广阔地广人稀区域,是天然的理想数据中心选址,既低成本又低延迟。

不过,长期来看,太空数据中心并非完全不可行。当太空经济真正兴起,在轨卫星数量激增、月球基地建设推进、太空工厂投入运营时,就近部署算力支持本地AI任务(如卫星交通调度、原位资源利用)将变得极具必要性。届时,太空数据中心将服务“太空原生AI应用”,延迟不再是硬伤,而辐射防护与能源获取技术也可能同步突破。

如果在未来的话,太空中可能会有哪些人工智能应用啊?……太空工厂它天然就是一个AI原生、机器人原生的生态。

太空AI经济:从卫星交通到月球加油站

太空AI应用的落地场景正快速拓展,远超传统遥感与通信范畴。张璐以Fusion Fund已投项目为例,勾勒出一幅活跃的太空AI生态图景:

  • AI卫星交通管理系统:应对日益拥挤的近地轨道,通过算法预测并规避碰撞风险,同时将高质量卫星数据转化为商品,服务于地球端的矿产勘探、山火预警、气象建模等;
  • 月球原位资源利用机器人系统:在月壤中提取水,再电解为氢氧燃料,构建“太空加油站”,大幅降低深空探测的燃料携带成本;
  • 微重力太空工厂:利用无重力环境合成新型晶体、材料乃至蛋白质结构,突破地球制造瓶颈,尤其利好生物医药与先进材料领域。

这些应用的共性在于:高度依赖自动化、远程运维与实时决策,天然契合AI与机器人技术。在人力成本高昂、环境极端的太空环境中,机器人不仅更经济,也更可靠。张璐强调,太空本身就是一个AI native + Robotics native的领域——从底层架构就为智能系统而生。

值得注意的是,当前太空活动的监管框架仍显模糊:低轨轨道虽由国际组织协调,但外层空间的主权归属、责任划分、频谱分配等核心问题尚无全球统一规则。这也正是马斯克倾向太空部署的重要动因之一——在规则真空地带,率先者可定义新秩序。

太空经济的规则真空与马斯克的野心

当前太空经济仍处于高度早期阶段,缺乏明确的管辖权划分——尽管存在国际组织对低轨道进行一定监管,但“领空”之外的太空区域尚无清晰主权归属,导致各国与企业在此拥有相对较高的行动自由度。这种制度空白反而为像马斯克这样拥有宏大愿景的公司提供了战略窗口:他不仅在构建Terafab——一个旨在实现1太瓦(1 TW)算力产能的太空算力基础设施,更在尝试成为太空经济的规则制定者而非仅是参与者。

“他可能也可以成为未来整个太空经济的一个规则制定方。”

“现在有点这种先到先得的感觉。”

这种“先到先得”的逻辑正推动各国加速布局:美国已明确提出三年内重返月球并建立月球基地,NASA与商业伙伴正共同探索资源开采与在轨燃料生产等关键能力。而轨道资源的稀缺性与监管执行难题(如卫星退役后如何回收)进一步加剧了“占轨即占利”的竞争态势。马斯克通过垂直整合——从火箭(SpaceX)、卫星(Starlink)、终端(Starship用户终端)到机器人(Optimus)、芯片(Groq收购)与算力(Terafab)——正在构建一个跨公司的工业操作系统,其核心目标是将整个马斯克生态的算力主权牢牢掌握在手中,而非依赖外部GPU供应。这一系统不仅服务于Tesla、xAI等内部业务,更面向未来机器人社会、大规模AI推理与卫星边缘计算等远期需求。

AI基础设施:从芯片到生态的范式跃迁

英伟达在2024年GTC大会上清晰传递了其战略转型信号:从“GPU芯片公司”转向“AI基础设施公司”。黄仁勋明确提出“token经济”概念,强调未来算力收入将主要来自持续性的推理负载,而非一次性训练消耗。这一判断背后是算力重心的结构性迁移:推理将成为长期、高频、高成本占比的核心环节,尤其在智能体(agentic AI)普及后。

“他卖的并不是一张卡或者一块芯片,他卖的是一个完整的系统。”

为此,英伟达正加速整合其生态能力:不仅发布7款新芯片(含Grok收购后的LPU推理引擎),更推出Vera Rubin平台,将CPU、GPU、高速互联(interconnect)、存储、CUDA系统与推理部署方案打包为统一基础设施。其目标是构建一个可扩展、高能效、面向推理优化的AI工厂,而非孤立硬件。这一转变也倒逼整个产业重新思考基础设施的护城河——单纯采购GPU已无法保障竞争力,自主可控的AI基础设施能力正成为下一代科技巨头的生死线

创业窗口:太空数据中心尚早,AI基础设施正当时

尽管马斯克的Terafab愿景极具号召力,并已催生如Star Cloud等专注太空计算服务的初创公司,但当前在轨部署大规模数据中心仍不具现实可行性。主要瓶颈在于:发射成本虽下降,但巨型设施的入轨与在轨维护成本极高;技术成熟度(如热管理、故障修复、辐射防护)距离工程化尚有7–10年周期;且太空AI应用的海量需求尚未形成。

“我觉得不是一个好时机……可以再看一看。”

相比之下,AI基础设施层的创业窗口已全面打开:从降低数据中心PUE与功耗、优化互联带宽(如光交换技术)、到推理加速与能效比提升,大量创新机会涌现。VC资本也正从纯软件转向深科技领域,尤其关注面向AI基础设施的硬件-软件协同创新。初创企业更应聚焦于服务型角色——如为大型算力集群提供模块化冷却、智能调度或光互联方案——而非直接挑战重资产的太空数据中心建设。未来真正的机会在于:谁能在算力密度、能效与可维护性之间取得突破,谁就将定义下一代AI基础设施的基准。

推理成本将主导AI基础设施支出

随着智能体(Agent)应用的广泛部署,AI系统的推理需求正从偶发性任务转变为持续性现金流式消耗。Jensen Huang在GTC上预测,到2027年其数据中心收入可能超过一万亿美元,这一判断的核心前提正是推理层面对token和计算资源的消耗将远超训练阶段。几年前,训练与推理的算力分配约为7:3或8:2;如今已接近五五开;而未来可能进一步倒挂为3:7甚至2:8——训练占比降至二三成,推理则占据六七成,且是持续在线、高频调用的状态。

“它在推理层面上的消耗会变成一个持续性的现金流,它是一个持续性的一个消耗。”

“在未来的话呢,推理在成本上的占比会越来越大,因为我们用推理的次数会越来越多,尤其是现在我们对整个智能体的铺设之后。”

多架构融合:CPU、NPU与异构生态崛起

AI基础设施正从“GPU一统天下”走向异构计算时代。英伟达近年不仅持续强化GPU生态,更通过发布Vero CPU(首次与GPU同命名体系)表明其对CPU战略地位的重新重视——该处理器被明确定义为全球首款专为agentic AI与强化学习打造的CPU,性能较传统CPU提升显著,并已获阿里巴巴、字节、Oracle、Meta等中美头部客户采用。

与此同时,NPU(神经网络处理单元)在边缘端的价值日益凸显,如高通持续投入低功耗NPU研发;而英伟达收购Lapton AI(贾扬清创立)与Nexus Flow(焦建涛创立)后,迅速将其整合进DGX Lapton Platform,强化其云原生推理部署能力。更关键的是,Grok(原Grok AI)的收购虽以非独家技术授权+人才引进形式完成,却为其带来了低延迟、高吞吐的推理架构优势,尤其在memory architecture方面表现突出,弥补了英伟达在专用推理路径上的短板。

“Grok的整合……其实我还挺意外的,我觉得它整合的很快的,它其实去年底才收购,对吧?就这个速度还是挺快的。”

“它对英伟达的价值,并不只是单纯的一个芯片产品……其实是补全了它整体生态整体的这样的一个故事线和它的生态层面上各个方面的一个集合的一个能力。”

全栈能力成科技巨头竞争核心

当前AI竞赛已进入“全栈整合”阶段:能否提供从芯片、框架、模型到部署平台的一站式AI工厂解决方案,成为企业护城河的关键。英伟达正加速构建这一能力——通过CPU、GPU、推理加速器、高速网络与存储的深度协同,打造真正闭环的基础设施平台。若CPU仍依赖外部厂商,其整机/整柜性能优化与客户黏性将受限;而掌握CPU后,它可提供更高集成度、更优性价比的系统级方案。

这一趋势下,谷歌(TPU+云+模型)、苹果(芯片+终端+OS)、Meta(自研芯片+开源框架)等均在强化全栈布局。马斯克则凭借特斯拉的三维真实世界数据、SpaceX的工程与太空数据,构建世界模型所需的高质量多模态数据闭环,进一步拓展AI能力边界。正如业内共识:未来科技霸主,必须是AI基础设施的全栈定义者

马斯克的三维世界数据壁垒与xAI生态

当前AI发展路径正从语言模型(LLM)向多模态(multimodal)演进,再进一步走向智能体(agent)乃至世界模型(world model)。而构建世界模型的核心,不仅依赖模型能力,更关键的是高质量三维真实世界数据——这一点上,马斯克的生态具备难以复制的系统性优势。

他手握多维数据源:特斯拉的交通与工厂三维实景数据SpaceX的卫星与太空工程数据、以及未来人形机器人(Optimus)所生成的物理交互数据。这些数据不仅规模庞大,且高度多样化、真实性强、覆盖物理世界多场景,远超其他科技公司仅有的视频或二维图像数据。若能有效整合,其AI生态将实现从“感知”到“理解-推理-行动”的闭环跃升。

值得注意的是,xAI近期经历联创集体离职潮,表面看是模型进展未达马斯克预期,实则反映其独特的管理哲学:“Done is better than perfect”“他不怕打脸,犯错后调整速度极快”。他以极强的愿景感与执行力吸引顶尖人才(如某联创被“说服三年”才加入),同时以高压高强度文化推动创新——团队常工作至凌晨,马斯克本人凌晨一二点仍参与头脑风暴。这种风格虽带来高流失率,但也确保了决策效率与执行力。

更关键的是,xAI已正式并入SpaceX体系,成为其生态核心AI引擎。这意味着它不再是一家传统初创公司,而是可直接调用特斯拉、SpaceX全体系人才与资源的战略单元。结合其独有的真实世界三维数据优势(尤其是卫星与太空数据),xAI有望在即将到来的太空经济浪潮中乘势而上

“你很难说能有另外一家公司可以像xAI这样作为一个所谓的初创企业调用到这么多的资源。”

“xAI现在已经正式作为SpaceX的一部分了……它会有一个加速的一个过程,因为乘势而为嘛。”

TPU vs GPU:生态闭环决定算力效能

谷歌在TPU(Tensor Processing Unit)上的投入已超十年,远早于当前AI热潮,体现出其对推理算力长期战略价值的深刻认知。TPU的真正优势并非芯片本身,而在于与谷歌全栈生态的深度耦合优化——从芯片设计、编译器(如XLA)、框架(JAX)、到数据管道与应用场景反馈,形成高效闭环。

这一闭环带来显著效益:谷歌内部使用TPU时,训练成本仅为OpenAI ChatGPT的三分之一左右,性能与能效俱佳。但一旦交付第三方用户,由于缺乏完整的系统层适配(如缺少类似CUDA的成熟软件栈),性能与成本优势大幅缩水。这印证了一个核心逻辑:算力效能高度依赖系统级协同优化,而非单一硬件指标

因此,短期内TPU难以对英伟达GPU构成实质威胁。尤其在当前AI部署尚处早期(各行业渗透率不足1%)的阶段,未来算力需求将呈指数级增长,单一架构无法承载——市场亟需多样化计算架构共存互补

有趣的是,谷歌正通过支持其创始人背景的创业公司(如JAX生态开发者)来扩大TPU影响力。部分xAI早期成员亦有Google背景,熟悉其技术栈,降低了迁移门槛。这也反向推动英伟达加速构建全栈式开发者生态(CUDA + SDK + 框架支持 + 云集成),以提升平台粘性,形成“软硬一体+开发者锁定”的护城河。

“如果你把TPU给到第三方去用……它的芯片能力其实没有在谷歌内部用的那么好。”

企业级AI:垂直整合与数据资产化加速

2024年是企业级AI(Enterprise AI)的爆发元年,其特征不仅是技术演进,更体现为产业整合速度与落地深度的同步跃升。两大趋势尤为突出:

其一,高监管行业(金融、医疗、保险)正加速采用小语言模型(SLM),因其支持本地化/私有云部署,满足低延迟、零幻觉、强数据隐私等刚性需求。小模型还显著降低算力与能耗成本,使AI落地更具经济可行性。

其二,大企业正从“数据囤积”转向“数据资产化”:通过数据清洗(data curation)、构建隐私增强中间层,将原始数据转化为可驱动AI应用的资产。Fusion Fund的CXO网络显示,头部企业CTO手中AI相关预算激增(最高达120亿美元),推动技术收购、战略合作与快速集成——部分金融机构已实现3–4个月内完成AI系统落地

其中,医疗AI成为最亮眼赛道:美国医疗占GDP 20%,拥有海量高质量数据与多元场景。英伟达与意大利制药公司达成数十亿美元合作,OpenAI、Anthropic等亦推出医疗专用模型。高质量数据正快速转化为垂直AI产品,开启“数据-模型-临床价值”的正向循环。

“大家发现了医疗领域不只是有巨大的市场量级……它也有海量的高质量的数据,而且还有多样化的应用场景,这些都是在人工智能应用层面上非常非常关键的。”

医疗与垂直行业:AI落地的黄金赛道

医疗领域正成为人工智能应用落地的前沿阵地。其核心吸引力在于:美国医疗支出占GDP的20%,不仅市场规模巨大,更拥有海量高质量数据高度多样化的应用场景——这两点正是AI产品化与商业化最关键的底层支撑。在此基础上,大量垂直AI产品迅速涌现,尤其在制药、临床辅助、医学影像等环节。值得注意的是,联邦学习(Federated Learning) 技术的推广,使医疗机构能在满足严格数据隐私监管的前提下,实现跨机构协作建模,进一步扫清了落地障碍。这种趋势也延伸至金融与保险行业,形成“医疗、金融、保险”三大AI整合速度最快的垂直领域。与此同时,物流与供应链等传统行业也在加速铺设AI能力。正如张璐所言:

‘高质量的数据就可以更加的有助于小语言模型的搭建,还有包括部署。’

‘相对应的思维理念呢,也在金融行业、保险行业有比较明确的体现。’

B端AI:创业者的黄金窗口期

与C端市场被巨头牢牢把控不同,企业级AI(To B AI)正迎来爆发式增长窗口。传统行业龙头企业出于对核心数据安全的顾虑,不愿将关键数据上传至公有云或交由大型科技公司掌控,反而更倾向于与专注垂直领域的初创企业合作——这种信任关系极大加速了初创公司的产品迭代与商业化进程。数据显示,部分团队规模不足十人的AI初创企业,一年内收入即可从零跃升至2000万美元。美国市场尤其凸显这一优势:退出路径短而高效——去年Fusion Fund投资的五家公司被收购,其中四家在成立不到两年内完成并购,回报达10–20倍,远快于传统IPO所需的7–10年周期。这种“短平快”的退出机制,不仅促进资本与人才高效循环,更催生了一大批财富自由、使命驱动的连续创业者。正如张璐观察到的:

‘他们做很多新的创新的探索,核心目的是为了改变产业、改变世界。’

技术前沿:从基础设施到太空原生AI

张璐指出,当前AI创新正向三个方向深度聚焦:企业级AI、医疗AI与工业自动化。其中,他特别关注AI基础设施层的突破性创新,尤其是那些能解决inference成本、能源效率、内存瓶颈、系统安全与异构整合等下一阶段核心瓶颈的技术。在应用层,医疗机器人成为新热点——例如其投资的Medra(制药自动化机器人)与微型/纳米机器人项目,代表了AI与生命科学深度融合的新范式。此外,太空领域因其天然的AI原生与机器人原生属性,也被视为极具潜力的长期赛道。张璐强调,太空经济的爆发窗口已在眼前,未来两三年将是关键投资期。他本人因长期对太空探索的热情与创新信仰,将持续投入该领域。这一信念也映射出硅谷创业生态的独特性:全球顶尖AI人才高度聚集于此,其中移民背景(尤其亚裔、欧洲裔、以色列裔)占主导,他们选择美国的核心动因正是快速商业化B端AI的机会——如与摩根大通、柯氏工业(Koch Industries)等传统巨头的高效合作,周期可短至1–2个月。