年度回顾的契机与结构
本期播客是明浩在2026年1月底对2025年AI行业的一次系统性复盘,基于一份181页PPT——这是他个人历史上页数最多的一次。这份PPT原为某互联网公司内部宣讲准备,实际内部版本压缩至约120页,删减了大量通用内容,增加了业务定制部分;而本次公开版本保留了原始完整结构。标题定为“同一代技术,两个系统”,副标题是“2025到2026中美AI的并行展开”,明确划分了美国与中国两大叙事主线。尽管作者过去一年多次以美国视角为主(如2025年Q3及11月的总结),但年底节点促使他回归中美对比的传统:2024年终总结已尝试此框架,而2025年则因时间跨度(从2025年初至2026年初)和行业快速迭代(约每三个月需重写一次PPT)而再次展开深度对照。AI生成的导语精准概括了核心洞察:“2025年人工智能不再只是能力的竞赛,而是开始成为系统的展开。在同一代大模型技术约束之下,美国与中国几乎同时走向了相似的方向——更大的算力投入、更激进的资本叙事、更一致的技术想象;但当这些技术真正进入产业、组织与市场,差异开始显现。这是两套系统在同一时间各自展开的过程。”
原话:2025年人工智能不再只是能力的竞赛,而是开始成为系统的展开。
原话:在同一代大模型技术约束之下,美国与中国几乎同时走向了相似的方向……差异开始显现。
模型演进:从能力边界到推理爆发
2025年AI模型发展呈现指数级密集发布节奏:从年初的DeepSeek R1(至今刚满一年)、GPT-4o(2024年底发布)、GPT-4.5、GPT-5、GPT-5.1/5.2,到Cloud 4、Gemini 2.5/3、Sora 2、V5(Suno)、Nano Banana、Kling、Hailuo等视频模型,几乎每周都有头部厂商发布新模型。这一轮进展不仅体现在数量,更在于技术路径的深化:推理模型(Reasoning Models)迎来大爆发。据OpenRouter统计,当前超50%的开源/闭源模型已具备推理能力,成为行业标配。其技术演进路径清晰:从预训练→基础对齐→后训练(含中训练)→强化学习(尤其是可验证的强化学习)。这一路径也映射到头部AI实验室的组织架构——预训练、后训练与基础设施(infra)团队分工明确。进入2025年后,资源投入重心明显从预训练转向后训练:因预训练边际效益已显著下降(广义上可能仅挖掘了70%~80%潜力),而强化学习环境的搭建——包括任务设计、反馈构建、结果验证与工程化实现——成为中短期核心战场。除模型厂商自建外,一批专注强化学习环境的初创公司(尤其在编程、数学领域已验证高效)及垂直领域产品公司(如To B/SaaS企业为适配自身场景需定制环境)也加入生态共建。此外,传统数据标注公司仍在提供底层支持。
原话:Wait, how did we get here? Started 2025 AI, lit so bright. Then deepseek dropped and shook VCs overnight.
原话:But the bubble keeps inflating. China keeps scheming. But hold up, Google woke up out of nowhere. Gemini 3, V03, Nano, but none in the air. Snatched the crown like it was always theirs.
行业叙事:从实验室到资本浪潮
PPT结构采用“从X到Y”的连续逻辑推进,第一章即“从模型到产品,从lab到公司”,后续章节依次为“从产品到场景,从公司到行业”、“从行业到市场,从市场到资本”——体现技术落地的完整链条。2025年美国AI行业在叙事层面呈现显著特征:算力军备竞赛升级、资本泡沫持续膨胀、人才争夺白热化(如“formal poaching talent left and right”)。视频《Wait, how did we get here?》以戏谑押韵方式浓缩全年高光事件:DeepSeek R1引爆VC热情、Elon试图收购OpenAI、Sora 2震撼业界、Apple AI受挫后GPT-4o反超、Meta重组AI团队、Google Gemini 3强势回归等。值得注意的是,AGI(通用人工智能)的叙事从遥远愿景转向可感知的阶段性目标——视频中“Elon drop grow force at AGI in sight”即反映这一转变。而关于“AGI主桌”的比喻是否仍适用,也成为本章探讨焦点:随着AI能力边界持续突破(如图示从“局部凸起”到“覆盖人类能力圈大部分区域”),当前阶段处于“AI在多数任务上超越人类,仅少数领域仍弱于人类”的临界点,离真正AGI(完全覆盖人类能力圈)尚有距离,但路径已日益清晰。组织层面,头部厂商的技术分工与资源倾斜,正深刻塑造未来三年的技术演进节奏。
原话:Wait, how did we get here? Started 2025 AI, lit so bright. Then deepseek dropped and shook VCs overnight.
原话:But the bubble keeps inflating. China keeps scheming. But hold up, Google woke up out of nowhere. Gemini 3, V03, Nano, but none in the air. Snatched the crown like it was always theirs.
强化学习环境:AI时代的新基础设施
强化学习(Reinforcement Learning, RL)环境的构建,正从幕后走向台前,成为模型厂商竞相投入的核心环节。除了模型厂商自身,一批专注于RL基础设施的初创公司正在美国快速崛起——它们不直接训练大模型,而是为模型公司提供专业化的强化学习环境搭建服务,尤其在编程、数学等已被验证高效的领域。与此同时,To B和SaaS产品公司也在自建RL环境,因为通用模型的强化学习范式无法适配其垂直场景,必须定制化开发。
这一趋势催生了一个全新的细分赛道:RL时代的AWS。典型代表是曾被Meta收购的Scale AI,以及后来崛起的Murcer等公司,后者被定义为“为AI实验室提供任何需要人类反馈来提升智能系统的基础设施服务商”。该赛道价值在短短十七个月内从100万美元飙升至5亿美元,融资与收入双高增长,印证了其战略重要性。
值得注意的是,这类服务的核心并非自动化标注,而是高质量人类反馈的组织能力。正如苏格(Scale AI前CEO)Edwin Chen所言:
“训练后的优化其实是门艺术……我们会请法律、财务、工业界专业人士,甚至科学家来做‘数据标注’。”
这揭示了一个深层逻辑:强化学习环境的搭建方式,本质上代表了厂商在智能体行为塑造上的‘品味’与技术判断。杨志林在AGI Next大会上也表达了类似观点。因此,在中短期内,RL环境的构建能力,将成为模型厂商拉开差距的关键战场。
AGI的定义之争:从任务执行到自主学习
红杉资本在《2026 This Is AGI》一文中,提出了一个极具启发性的框架:当前AI正从OpenAI提出的L1(知识)→L2(推理)→L3(Agent)演进,而L3的核心指标是‘长时任务执行能力’——即AI能否自主完成跨步骤、跨工具、跨模态的复杂任务链。
文中举了一个生动案例:招聘一名强化学习研究员。理想AI Agent的流程是——在YouTube找演讲→识别讲者→在Twitter评估其技术影响力→分析其职业轨迹与离职倾向→筛选并发送定制化邮件。整个过程约半小时完成,远超人类猎头效率。红杉认为,这种端到端解决问题的能力,就是AGI的现实定义。
“美女是没法定义的,但是你看到的时候,她就是了。”
这一比喻被广泛引用:AGI没有统一技术标准,但其存在感在具体任务中清晰可辨。进一步地,红杉指出,自主学习能力的突破,可能意味着L4(创新者)阶段的提前到来。这也解释了为何2025年下半年以来,硅谷涌现出一批“New Lab”型创业公司——由头部公司核心研究人员创立,聚焦下一代研究范式(如伊利亚的公司、米尔的公司),尽管商业化尚远,但底层技术探索已成新焦点。
与此同时,AI for Science的升温也与此呼应:OpenAI推出面向科研人员的产品,正标志着AI正从通用推理迈向自主科研创新,即L4阶段的实质落地。
主桌合一:多模态、语言与Agent的融合趋势
过去常被割裂看待的“语言”“多模态”“Agent”“Coding”“World Model”等能力模块,正显现出高度耦合、趋于一体化的特征。作者通过两个亲身案例佐证:
其一,用Notebook LM为儿子制作PPT——模型不仅理解《火影忍者》与《蛋仔派对》的叙事逻辑,还能将技术原理与故事内核映射为可视化图谱;
其二,为女儿幼儿园演讲制作立体书风格PPT:输入实体书照片+YouTube视频链接后,模型不仅复现《三只小猪》情节,还精准还原了书页的立体展开结构,实现内容与形式的双重理解。
“我把幼儿园家长演讲用的PPT卷到了一个他不应该有的高度,对吧?这个要感谢AI。”
这表明:语言、图像、视频、语音、代码已不再是独立能力模块,而是一张统一的能力网络。多模态与Agent的差距(>30%与>70%)远大于纯语言模型头部玩家间的差距(<3%),倒逼产业重心向高ROI领域倾斜。
在世界模型方向,也呈现两派路径:视频流交互派(如Pixverse的无限流生成)与物理仿真派(李飞飞WorldLab、DeepMind方向)。后者因严格遵循物理定律,正成为具身智能与自动驾驶的“虚拟实验场”,为现实世界训练提供稀缺数据——尽管距离理想状态仍遥远,但已打开关键突破口。
Chatbot战场:Gemini反超,OpenAI战略承压
截至2025年1月16日的Chatbot流量数据显示,OpenAI仍居首位,但Gemini正以惊人速度追赶——其市场份额已从年初不足个位数,跃升至15%–25%区间;而GPT系列则持续被侵蚀。这一趋势直接动摇了此前“ChatGPT已赢下Chatbot战役”的共识。尤其在2024年8月后,竞争格局显著变化:Gemini自3月发布以来,至2026年初已逼近GPT的38%–40%份额,增速远超OpenAI同期(ChatGPT 2025年增长约50%,而Gemini达560%)。
更值得注意的是,在To B市场,Anthropic已对OpenAI形成领先优势。OpenAI被迫加速推进API商业化与PR攻势,并将IPO计划从原定2027年提前至2026年Q4;而Anthropic预计将在2027年实现正向现金流,OpenAI则可能延至2030年。OpenAI采取“成年人全都要”的扩张策略——覆盖应用层(浏览器、社区、电商、广告)、底层基础设施,甚至硬件;而Anthropic则聚焦“coding加一切”,其Cloud Code成为史上最快达10亿美元ARR的AI应用,在模型调用量上于编码领域市占率超60%。
Gemini三发布之后,截止到二零二五年底、二零二六年元旦那个左右时间,Gemini已经追到了拆GPT的大概百分之三十八到三十九,就追到了拆GPT的百分之四十。
OpenAI的策略特别简单,成年人全都要……做应用,做浏览器,做社区,做电商,广告已经上线了,未来也想做infra底层设施,然后甚至可能还想做硬件,全都做。
Agent崛起与垂直场景爆发:从Coding到医疗
2025年,AI从Chatbot向Agent演进成为核心趋势——Agent需具备推理、长上下文记忆、工具调用、计划生成与结果反馈能力。整个Agent生态(含基础设施、垂直Agent与通用Agent)发展迅猛,亚马逊、Google、微软三大云厂商同步发力模型+Agent双线布局。
在具体赛道上,据2025年11月报告,To C领域十大AI赛道包括:聊天机器人、设计工具、视频/图像编辑、搜索、虚拟角色、图像生成、教育、写作效率等;而To B端则按“职能+行业”双维度重构分类体系: - 职能维度:工程师、销售、HR、财务、IT、市场、客服等; - 行业维度:医疗、法律、金融、教育、家庭服务、政府等。
这种细化催生巨大增量市场:第三方预测,AI在知识工作、医疗、软件工程、法律、艺术媒体等领域的综合收入可达600亿美元,远超早期仅关注To C软件的估算。
其中,Coding赛道成为最典型代表——2025年市场规模已达约40亿美元。头部公司如Cursor、Replit、Anthropic的Cloud Code、OpenAI的CodeX持续刷新收入增长纪录:从2年缩短至6个月达1亿美元AI收入。但Q3起,独立Coding公司流量下滑,主因是模型厂商第一方工具强势崛起,引发“模型厂商吃掉独立公司”的行业隐忧。
与此同时,医疗成为第二大爆发点:据OpenAI数据,2025年医疗AI应用增长达8倍(编程为11倍),预计带来35亿美元增量市场。OpenAI与Anthropic同步推出独立Health应用,类比门户网站从泛门户转向垂直频道——当某领域技术成熟,就会催生独立垂直产品。
Coding这个板块……似乎实现了前面所说的自主进化了,不是吗?可能人类参与了一点点,但再往后推呢,似乎也不那么需要人类了。
产业视角:多层分工下的‘晋西北乱局’
回顾IT产业演进史(PC→网络→桌面互联网→移动互联网→云/SaaS→AI),当前AI产业链已形成清晰分层: 1. 底层能源/芯片:NVIDIA、AMD、Broadcom; 2. 数据中心/云:New Cloud公司、AWS、Azure、GCP; 3. 模型层:OpenAI、Anthropic、Google、Meta、xAI; 4. 软件层:Salesforce、Snowflake、Microsoft、Planner; 5. 应用层:垂直SaaS、独立AI应用公司。
在这一结构下,行业呈现高度复杂的“你中有我,我中有你”格局:巨头间既是竞争对手,又是客户、供应商、投资人——如OpenAI采购云服务,Google投资Anthropic,微软既是Azure客户又是Azure供应商。2025年10月起的循环融资潮进一步加深这种交织关系。
Google成为全栈能力最强者:自研芯片(TPU)、云基础设施、大模型(Gemini)、应用生态(Workspace、YouTube)全面领先,这也是其股价持续走强的根本原因。相比之下,其他公司多在部分环节占优,难以实现Google式的全链路覆盖。
一句话形容今天这个时间点的美国AI行业,就是晋西北乱成一锅粥……你很难说谁跟谁就是绝对的敌人,谁跟谁就是绝对的朋友,整个江湖就是乱成一锅粥。
巨头公司的能力矩阵与产业分工
从产业链分工视角出发,可将科技巨头按其在芯片、数据中心、云服务、API、模型、企业服务、To C市场及机器人等关键板块的能力强弱进行评估,形成一张“能力雷达图”:覆盖板块越多、越强,公司整体竞争力就越强。Google 是这一逻辑的典型代表——其在几乎所有核心环节均具备领先优势,包括自研芯片(如TPU)、强大云基础设施、Gemini大模型、Chrome生态整合、App合作网络及全球推广能力,这些共同支撑其模型领域的绝对主导地位。简化来看,若一家公司在芯片、基础设施、模型与应用层均表现强劲,其长期竞争力将极为突出。
Google强的可怕。简化来看。芯片、基础设施、模型、应用,如果都很强,那看起来……
最近不是谷歌Chrome终于接入了Gemini,自己的推广、自己的App的合作,来保证自己在模型领域的超级强势的地位。
相较之下,微软在云服务(Azure)上实力雄厚,模型与应用层中等偏强,但在芯片自研能力上相对薄弱;AWS(亚马逊云)虽为云市场龙头,但其自研模型Nova表现一般,芯片层尚可;而OpenAI、Zoap等公司虽在模型与应用层表现优异,却严重依赖外部芯片与基础设施,因此亟需向下延伸构建闭环——这正是其战略转型的底层动因。
AI作为软件第四代浪潮的结构性特征
若以软件演进视角审视,AI浪潮实为软件行业的第四代大浪,其核心特征已从单纯工具性软件,演进为人机协同、云端原生、产品驱动增长(PLG)导向的新范式。当前崛起的代表性产品——如Perplexity、OpenAI GPT、Midjourney、Minas等——均高度契合这一代际特征。
值得注意的是,这一轮浪潮正与上一代(第三代)软件公司的发展周期交汇:Figma、Notion、Canva等第三代代表企业,恰逢其业务成熟期与AI赋能窗口期叠加。AI不仅未对其构成替代威胁,反而为其注入新的增长动能,形成“正向buff”效应。从更宏观的周期视角看,每一代软件浪潮均呈现约5年周期、3倍市值增长的规律:移动互联网(2010–2015)、云计算(2015–2020)、AI(2020至今)。当前AI浪潮的爆发速度远超前代——仅用3–4年便逼近前代需10–20年才能达到的万亿级市值规模。
资本市场的AI驱动型结构性牛市
2025年已成为AI主导的史诗级资本浪潮的集中兑现年。据美国某机构统计,每一代技术浪潮中头部相关公司市值总和均呈约3倍增长:云计算阶段已达约6.5万亿美元,按此推演,AI阶段头部公司集合有望达20万亿美元量级——而截至2025年,英伟达(4万亿+)、苹果、微软(各3万亿)、亚马逊、Meta、博通(各1–2万亿)等已接近该规模,尚未计入OpenAI、Anthropic等未上市巨头。
公开市场数据印证了这一趋势:2025年AI相关公司贡献标普500总市值增长的37万亿美元(+33%);一级市场中,Karma、OpenAI、SpaceX、Stripe等贡献18万亿美元增长(+19%)。更鲜明的是对比:过去三年(2022–2025),AI公司推动标普500涨幅达185%,而非AI公司仅28%。
从板块分布看,科技巨头引领全线上扬:谷歌(+62.4%)、博通(+51%)、英伟达(+38.5%)、微软(+37.8%)包揽标普前十涨幅前列;“M7”(微软、苹果、谷歌、亚马逊、Meta、英伟达、特斯拉)平均涨幅22%,显著高于标普500的17%。前十大科技公司市值已达25万亿美元,占标普500总市值(62万亿)的40%,凸显“巨无霸集中化”趋势。
一级市场与并购:泡沫还是健康扩张?
一级市场同样深度绑定AI:2025年AI公司占一级市场融资额的48%,超级单轮融资(超10亿美元)中AI占比超60%。头部项目融资额惊人——OpenAI单轮41亿美元、Anthropic 32亿、xAI 12.8亿;估值方面,OpenAI达500亿美元(收入130亿,PS 38x),Anthropic估值更高(PS 50x),而xAI仅10亿美元收入却估值230亿(PS 230x)——高估值背后,本质是投资者对马斯克个人IP与技术想象空间的押注。
值得注意的是,AI独角兽从产品发布到成为十亿美金收入公司平均仅需2年,远快于传统科技公司;但退出渠道仍显狭窄:IPO数量远逊于2021年高峰,仅Figma、Cohere等少数案例;并购成为核心退出路径,2025年涌现多起“掏空式并购”:NVIDIA以200亿收购推理芯片公司Groq,Meta以未公开金额收购Manus,Google收购Winsoft、NVIDIA加码Cohive——均指向推理、Agent等下一代技术方向。
关于泡沫争议,关键指标显示当前估值仍处健康区间:当前头部AI公司平均PE约30倍,远低于2000年互联网泡沫时期的80–100倍。从融资结构看,种子轮金额虽上升(存在“通胀”现象),但A轮及以上轮次融资环境明显改善,AI正从“资本实验期”转向“商业验证期”。
数据中心建设进入疯狂周期
当前,以Oracle为代表的云厂商及New Cloud公司正将未来五年的资本支出(CapEx)预期打满,目标直指2030年云市场三千至四千亿美金的收入规模。数据中心作为算力的物理载体,其建设已形成一张远超美国当年铁路网络密度与规模的基础设施网络。在运营中的头部科技公司数据中心总装机容量已达2.26 GW,而已承诺、在建及规划中的总量高达35 GW(自2025年起释放),预示着数据中心建设将进入前所未有的扩张周期。
这一轮扩张直接带动了存储产业链的爆发。回看2025年标普500涨幅前五的公司,前三名及第五名(美光、西部数据、希捷、Robinhood)全部为存储芯片企业,凸显存储环节在当前AI算力饥渴下的结构性稀缺性。存储厂商的垄断格局与极长的扩产周期(建厂到量产需2–3年),使得当前投入需在2027–2028年才能缓解供需紧张——但若届时AI需求再度跃升,短期短缺恐将演变为中长期结构性矛盾。
我们看到很多很多这样的新闻,所以在美国已经建好的、在建的、跟未来预期要建的数据中心,形成一张网络,这张网络似乎看上去比美国当年的所谓的铁路的网络更加的疯狂。
聊到这儿,这个问题就变简单了,对吧?就是这么大的投入。我们到底需要多少钱?
两万亿美金投入背后的资金缺口
市场共识认为,未来4–5年全球AI基础设施投入将达约两万亿美金,老黄(黄仁勋)及多家投行均持此判断。资金来源主要为三部分:科技巨头自有CapEx、私人资本与信贷支持。然而,仅靠科技巨头的经营现金流难以覆盖全部支出——例如Meta将2026年CapEx上调至1160亿美金,几乎等于其自由现金流,2027年及之后的可持续性存疑。
因此,发债成为填补缺口的主流路径。2025年Q3起,亚马逊、Meta、Google、Oracle等头部公司密集发行巨额债券。与此同时,GPU折旧的加速进一步加剧财务压力:尽管硬件寿命可达6–7年,但按性能衰减计算,折旧周期可能缩短至3–5年,导致企业折旧成本占比持续攀升,直接影响盈利能力。
这种资金压力在股价上已显性化:高杠杆、高举债的AI基础设施公司(如Nebius、Kov)在2025年一度暴跌超60%;而Oracle的股价走势堪称行业缩影——Q3因确认OpenAI五年3000亿美金订单暴涨,随后因现金流测算不足一路回落,至2025年底股价已回落至合同公布前水平,“白忙活一年”。
老黄也在这个这个应该是上个季度财报的时候说过的。未来四到五年,就是有两万亿美金在数据中心上……
产业链价值分配的结构性失衡
从用户层→应用层→模型层→云平台→数据中心→芯片制造(台积电)的完整链条看,越底层的环节越占据价值高地:英伟达凭借高达70%+的毛利率稳居价值链顶端;台积电作为绑定伙伴亦获稳定回报;云厂商与数据中心运营商收入虽持续增长,但面临激烈竞争与资本开支压力;而模型公司与应用层则深陷盈利困局。
一项美国科研机构的研究指出:以GPT-5为例,从训练、部署到推广的全周期投入,几乎无法被其上线后带来的收入增量所覆盖——模型层尚且难言盈利,应用层更甚。尽管用户侧的token使用量、订阅转化等广义收入模型看似可支撑投入,但“能算清的收入”与“实际发生的成本”之间仍存在巨大鸿沟。
此外,市场已分化为两大阵营:OpenAI生态(含SoftBank、Oracle、AMD、Microsoft、Cohere)与Google阵营(含Broadcom等),二者在2025年Q4出现显著股价背离,反映出投资者对不同技术路径与商业模式的深度博弈。2026年,这一对抗或将持续强化,进一步加剧产业链内部的价值重估。
用户使用各种各样的AI app,AI app跑在AI模型上,AI模型跑在云上,云跑在数据中心上,数据中心里面跑的是卡,卡的底层是代工,台积电,这个链条不就是这个样子,对吧?
收入与投入的硬约束
在AI行业,最核心的问题始终是:所有能被清晰建模的收入来源,是否足以覆盖天文数字般的投入成本? 用户转化带来的订阅收入、科技巨头的资本开支(CapEx)、To B服务、广告与电商等,这些收入路径看似可量化,甚至可计算极限值。然而,真正的挑战在于——这些收入总和能否覆盖当前及未来数年的巨额投入?
有测算指出,若希望AI相关公司到2030年实现5%的投入产出比,其年收入需达800亿美元;若追求15%的回报率,则需达到1.1万亿美元。对比当下:OpenAI年收入约130亿美元,Anthropic约70–80亿,即便将科技巨头的AI相关收入全部计入,距离目标仍有巨大鸿沟。这一冷峻数字揭示了行业当前的真实处境:资本正在押注未来,但未来能否兑现承诺,尚无确定答案。
“我们把KBS预期上调到了520–560亿美元,如果我们不审慎对待,这对台积电来说将会是一场灾难。”
“整个链条上应用、模型、云厂商、英伟达……我们似乎只能在台积电身上找信任感,这个市场现在不就是这个样子吗?”
台积电的信号与信任迁移
台积电的财报与分析师会议,成为本轮周期中极具象征意义的节点。作为以理性、冷静甚至冷血著称的行业基石,台积电罕见地将2025年资本支出预期从491亿美元大幅上调至520–560亿美元——增幅超30%。董事长明确表示:“如果不审慎对待,这将是一场灾难。” 这一表态本身即是一种强烈信号。
更关键的是,其上调预期并非孤立判断,而是基于过去三四个月间,与客户(英伟达)、客户之客户(云厂商、模型公司、Meta等)的密集沟通,确认了真实、持续、非短期炒作的需求。市场因此将此解读为“超级正向信号”——连最保守的底层硬件龙头都确认了需求,那整个链条似乎可以被信任了。
但吊诡的是,这种信任并非均匀分布。当前市场已对应用层(毛利微薄甚至为负)、模型初创公司(营收规模与万亿目标差距悬殊)、云厂商(尤其高杠杆的新势力)普遍存疑,英伟达虽盈利强劲,却也难逃“老黄总是赚钱”的叙事疲劳。于是,信任被层层下移,最终锚定在台积电身上——这本身已是一种市场情绪的极端反映。由此也解释了为何近期市场开始炒作硅材料、存储芯片等上游原材料:当信任链断裂,人们只能退而求其次,回到最基础的物理资产。
“整个链条上应用模型、云数据中心、英伟达、台积电……我们似乎只能去在台积电身上找信任感,这个市场现在不就是这个样子吗?”
中美模型对抗:开源崛起与群雄乱斗
DeepSeek R1于2025年1月20日发布,至今仅一年,其影响仍被严重低估。在全球范围内——尤其在经济欠发达地区——R1已成为关键的模型获取路径。而市场对DeepSeek的“尊重”,体现在其产品节奏之快:从V3、R1、V3.0324、R1.0528、V3.1/V3.2、OCR模型、数学模型,到近期的OCR 2.0,技术演进路径清晰呈现“死磕推理→融合能力→架构突破”的三阶段趋势。V4极可能在架构层面实现突破,其发布时间(2026年2月16日除夕)本身已成行业“倒计时信号”。
中美AI竞争已进入新阶段:开源正从策略升维为共识。中国开源模型在Hugging Face下载量已反超美国;模型能力上,2023–2025年间,中美开源模型平均差距已从数年缩短至7个月,且持续收窄。千问(Qwen)成为开源领域绝对龙头——2024年12月单月下载量超过其他所有开源模型总和。头部玩家如Kimi、DeepSeek、MiniMax、小米、阿里、美团等,几乎清一色选择开源路径。
与此同时,闭源模型竞争未停,但开源阵营的“群雄乱斗”格局已成:模型能力趋同、Agent功能趋同、入口体验趋同——主流模型截图不带Logo已难分辨。用户不再关心“谁做的”,只关心“能不能用”;厂商则聚焦于SOP封装、Cloud Skill构建、工作流嵌入等落地能力。技术上,中美共识集中在:探索智能上界(AGI)、提升scaling law效率、长上下文与记忆机制、多模态与AI for Science、Agent完成复杂任务等方向。
“如果你把整个中国的模型当成一个整体……中国模型的开源模型能力就领先全世界了。”
Agent入口的祛魅与技能(Skill)的普及
从用户视角看,纯入口形态的Agent已不再构成差异化认知——当MiniMax等厂商的产品去掉品牌标识后,普通用户几乎无法分辨其来源。这意味着,用户对“是否为Agent”的技术标签已不再敏感,转而更关注实际功能价值。厂商真正需要在意的,是能否提供可复用、可组合的技能(Skill)能力。这一趋势正迅速成为行业共识:例如,扣子2.0新增“技能”模块;Minimax的Agent则引入了所谓“专家”(实为技能封装的变体)。预计2026年,头部厂商将全面跟进技能体系构建,将其作为Agent产品化的标准组件。
技能也变成了各家都在跟进的功能。
表情包的变化也代表了行业发展趋势的这个这个样子。
超级应用前夜:Chatbot仍是核心战场,但格局剧烈震荡
尽管过去曾有“模型即产品,应用被吃掉”“Chatbot不算入口”等论调,2025年的现实数据却显示:Chatbot仍是AI应用最核心的战场——无论App、Web端,还是中美市场,其用户活跃度与使用深度均遥遥领先。以豆包为例,其日活在2024年底已持续攀升,2025年虽遭DeepSeek(R1)短暂超越,但后者因未发力To C,豆包迅速重夺主导地位;至2025年底,豆包日活据传已破亿,并作为春晚赞助商,在节日期间屡创单日峰值。
与此同时,阿里与蚂蚁迅速反击:千问C端月活宣布破亿(含App+Web),灵光与通义app加速推广;百度亦高调宣称文心一言月活突破两亿(PR口径)。“三国杀”格局正式形成:豆包、千问、元宝,谁能在春节红包大战与留存提升中胜出,将决定2026年主导权归属。值得注意的是,ChatGPT的留存曲线在2025年显著拉升,而豆包据称亦达成类似“微笑曲线”——初期高流失后快速回升,验证其产品成熟度跃升。
二零二四年大家就在说豆包已经赢了……二零二五年,很多人都说,但你细想这个时间点,这些结论似乎都开始出现了松动。
传说豆包的日活已经破亿了。今年豆包跟火山是春晚的赞助商,春晚当晚豆包一定会达到一个新的日活巅峰,一定,对吧?
多模态的‘中国式繁荣’:从分桌到合桌,硬件与出海成新支点
多模态领域呈现“分桌竞争、合桌终局”的双重图景:在模型榜单中,中国厂商占据前三十中的十九席(含字节、Minimax、快手、腾讯等),应用端更显繁荣——极梦、可灵、Pixwords、剪映等本土产品百花齐放;出海方面,国际榜单前二十中约七成为中国公司主导,且几乎全部聚焦图片/视频生成(如皮卡、黑信等)。然而,头部厂商的战略已悄然转向统一多模态架构:千问明确将“统一多模态理解与生成”列为未来目标;智谱发布首代图像模型;Kimi 2.5更以原生多模态架构实现视觉+文本输入、Agent任务与对话无缝协同,成为当前开源模型中全能性最强者。
在此背景下,字节、阿里、腾讯三大新BAT在多模态底层模型与应用层的军备竞赛将进一步加剧。与此同时,AI硬件成为VC共识:AI玩具、学习机、摄像头、人形机器人等密集涌现,CES中国展商近四十家;而AI+社交、AI+旅游、AI+游戏等融合方向亦快速落地——如Toln(MAU仅20万)与Carol.ai(市场停滞)在海外遇冷,反观中国本土的猫香、星野、Second Me等产品已实现用户规模与商业化突破;AI旅游游戏(如EVE、星眠、无限谷)则因强商业验证能力成为务实选择。但需警惕:“很多创始人对游戏缺乏敬畏”,或成关键瓶颈。
统一多模态理解和生成是千问的一个未来目标。
很多在这做这个板块的创始人,对游戏这件事情缺少敬畏。
阿里:生态协同与芯片自研双轮驱动
在三大科技巨头中,阿里在AI竞争中具备结构性优势,核心在于其自研芯片业务(平头哥)与大模型能力的深度协同。有内部消息透露,阿里内部已有千万级用户在使用自研芯片进行模型训练——这一路径与Google持续用TPU训练Gemini模型高度相似,标志着其从“模型自研”向“全栈可控”的关键跃迁。
更值得玩味的是千问(Qwen)战略定位的演变。对比两张关键时间点的发布会图景:2023年4月千问初发布时,是“通义千问在前,阿里生态业务logo列后”,口号为‘阿里所有产品未来将接入大模型,全面升级’;而2026年1月新App上线时,则变为“阿里生态业务集体站台”,台后标语明确为‘阿里生态业务组队来问千问App为您服务’,背后是淘宝、支付宝、飞猪、高德、盒马等十余家业务单元的Logo密集排列。这一变化清晰呈现了从“技术驱动接入”到“生态深度整合”的战略升维。
‘阿里生态业务组队来问千问App为您服务’
‘阿里所有产品未来将接入大模型,全面升级’
蚂蚁虽常被归入阿里系,但其在AI战略上实为独立体。近期CEO在《晚点》采访中直言不讳:此前因外部环境受限,如今已‘翻篇’,亟需‘支棱起来’。其推出的灵光基座模型与健康应用阿福,既是对过往‘脏活累活’(如早期医疗数据积累)的整合,也体现其‘基座探索’(灵光)与‘刚需必赢’(阿福)的双轨逻辑。更关键的是,蚂蚁战投被评价为当前AI应用领域最激进的战略投资者之一——这进一步印证其独立作战能力与长期投入决心。
腾讯:蛰伏后发,社交AI破局
腾讯在AI领域的动作虽显克制,但并非停滞。2025年底姚顺宇的加盟与新皮层发布的《腾讯AI模型三年组织图》共同表明:其已完成混元模型团队的架构再梳理,进入‘准备就绪、伺机而动’阶段。
真正的破局点出现在社交场景——元宝App上线‘元宝派’群聊功能,支持AI参与聊天、调节气氛、推荐内容,甚至协同观看腾讯视频、收听QQ音乐。该功能设计明显复刻了Clubhouse的沉浸式语音社交逻辑,而负责人正是原腾讯会议团队核心,使‘派’兼具会议协作属性,形成独特混合体验。
‘元宝派像一个AI陪大家互动的社交空间……一起共享AI时代的社交乐趣’
这一系列动作直指2025年春节:元宝投入11亿红包、联合集五福(由支付宝‘灵光’与‘阿福’支撑),与百度(文心一言5.0发布+春晚5亿红包)、字节(豆包+火山引擎为春晚赞助商)形成新一轮‘AI红包大战’。这场竞争不再是单纯流量争夺,而是AI能力在真实用户场景中的集体路演——腾讯显然已从‘等待机会’转向‘主动出招’。
百度与中美AI格局:估值锚定与叙事重构
百度虽已退出‘新BAT’讨论中心,但其2025年表现不容忽视:文心一言5.0版本发布、昆仑业务拆分、文库与网盘重组为新事业群,推动股价半年内翻倍,当前市值达554亿美元。尤其在AI赋能下,文库业务实际增长显著,只是未被主流叙事关注。
更深层的观察来自中美AI格局的结构性对比。基于头部公司估值,可提炼出一个‘1%–2%估值原则’:中国AI相关硬科技公司估值约为美国对标企业的1%–2%。例如: - 英伟达(4.5万亿美元)×1%–2% ≈ 3000–6000亿人民币 → 对应国产GPU公司估值区间; - SpaceX(1.5万亿美元)×1%–2% ≈ 1000–2000亿人民币 → 对应商业航天公司估值; - OpenAI(830亿美元)×1%–2% ≈ 550–1100亿人民币 → 对应Minimax、智谱等估值。
‘谁都没有A股懂大模型,懂GPU,懂存储,懂芯片,懂光通信’
这一估值锚定并非戏谑,而是政策与资本共识的体现。2025年,中国AI投资回暖:融资总额超2021年峰值;美元基金占比从10%降至2.5%;硬科技(芯片、商业航天、具身智能、大模型)成共识赛道;A股与港股IPO数量回升,港股首次超越A股成硬科技企业首选上市地;更值得注意的是,中国纯硬科技公司的退出金额在2025年已超过美国——因美国IPO窗口未真正打开,退出项目多非纯硬科技。
最终,AI竞争已非单点胜负,而是一场系统性叙事重构:若中国在算力与应用上同步突破,或将迎来‘中国特色AI时代’;若美国维持模型领先但受限于能源瓶颈,则可能形成‘美国标准+盟友体系’的二元格局。
AI竞争的四象限模型
播客中提出了一种基于算力与模型应用两个维度的四象限分析框架,用以评估中美在AI领域的竞争格局。核心逻辑是:若美国在算力领先与应用领先上同时占优,则可视为其赢得AI战争;反之,若中国在算力与模型应用上同步增强,则可能催生中国特色AI路径。然而,极端对立的两极格局可能难以实现,更现实的图景是——美国在AI能力与采用度上整体更强,却受限于能源与基础设施瓶颈,在算力部署上反而处于相对弱势;而中国虽在模型能力上略逊一筹,却凭借算力成本优势与规模化部署能力,可为其他发展中国家提供定制化AI解决方案。这种不对称优势将推动形成一种非对称的双轨体系:美国主导以盟友(如欧洲)为成员的“信任联盟标准”,中国则依托性价比与本地化适配能力拓展“全球南方”市场。
走向非对称双轨的AI地缘格局
这种未来格局并非简单的“赢者通吃”,而更可能呈现为标准分裂、生态割裂、技术路径分化的双轨制。美国将依托其技术标准输出能力与政治盟友网络构建封闭或半封闭的AI生态;中国则依靠工程落地效率与本地化适配能力,在非西方体系中建立替代性基础设施与应用生态。值得注意的是,这种分化并非零和博弈,而是功能互补性增强的结构性演变——例如,全球企业可能根据业务区域与合规要求,分别接入不同技术栈。正如播客所言:
未竟的革命与持续的观察
播客以一句‘AI革命尚未成功,这个行业还在疯狂的发展’收束全篇,强调当前仍处于技术爆发的早期阶段。作者特意赶在DeepSeek V4发布前完成内容整理,既是对技术迭代速度的敬畏,也体现了其作为行业记录者的自觉——愿继续扮演AI时代的‘司马迁’,以系统性、持续性的观察,为未来回溯留下真实坐标。PPT与时间轴资料已同步公开,鼓励听众以沉浸式方式反复研读,把握这场变革的深层脉络。