CPU需求暴涨与巨头财报炸裂
继GPU和存储芯片之后,AI算力的焦虑正式蔓延至CPU领域。从2025年底开始,服务器CPU的价格飙升了近30%,交货周期甚至拉长到了半年之久。曾经被视为AI“配角”的CPU,正重新回到舞台的中心。这一变化不仅体现在供应链的紧张上,更直接反映在各大科技巨头的财务表现中。AMD、英特尔和ARM的财报集体炸裂,显示出市场对CPU需求的急剧升温。与此同时,连英伟达也下场抢食这块蛋糕,标志着CPU在AI基础设施中的地位发生了根本性转变。
“从2025年底起,服务器CPU价格飙升近30%,交期甚至拉长到半年。”
这一轮短缺并非简单的周期性波动,而是由多重因素共同驱动的复杂现象。视频将从Agent爆发、超长上下文处理、数据中心配比变化等多个角度,深入拆解这轮CPU短缺背后的真正原因。核心问题在于:为什么GPU越强,反而越依赖CPU? 随着AI应用的落地,整个计算系统的瓶颈正在发生转移,CPU不再仅仅是数据的搬运工,而是成为了决定系统整体效率的关键环节。
Agent兴起:GPU越快,CPU越堵
AI Agent(智能体)的兴起是本轮CPU需求暴涨的核心驱动力之一。与传统的批量处理任务不同,Agent需要实时与外部环境交互,进行复杂的逻辑判断、工具调用和状态维护。GPU擅长并行计算,但在处理串行逻辑和复杂控制流时效率低下,因此大量的预处理、后处理以及逻辑调度工作必须依赖CPU。随着Agent应用的普及,这种“GPU计算+CPU调度”的模式导致CPU负载急剧增加。
“GPU越快,CPU越堵。”
这种现象被称为“木桶效应”的逆转:过去GPU是短板,现在GPU性能过剩,CPU反而成了瓶颈。在Agent场景中,每一次推理请求都伴随着大量的上下文解析、记忆检索和动作规划,这些任务对CPU的单核性能和多核并发能力提出了极高要求。如果CPU处理不过来,GPU再快也只能闲置等待。这种架构上的依赖关系,使得CPU在AI基础设施中的价值被重新评估,需求随之爆发。
百万Token时代:上下文越长,CPU活越多
随着大模型上下文窗口(Context Window)的不断扩展,进入“百万Token时代”,CPU的工作量也随之激增。长上下文处理不仅仅是存储数据的增加,更涉及复杂的注意力机制计算和数据预处理。GPU在处理长序列时,虽然能并行计算注意力分数,但数据的加载、清洗、分词以及结果的后处理,全部需要CPU介入。
“上下文越长,CPU活越多。”
在长上下文场景下,CPU需要处理海量的非结构化数据,将其转化为模型可理解的格式,并在推理结束后对输出进行结构化提取。这一过程对CPU的内存带宽和缓存命中率提出了极高要求。随着模型能力的提升,用户倾向于输入更长的文档或代码库,这直接导致CPU的计算负载呈指数级增长。CPU不再是简单的数据通道,而是长上下文处理的关键瓶颈,其性能直接决定了AI应用的用户体验和响应速度。
晶圆生产:台积电售罄,英特尔良率爬坡
供应端的紧张加剧了短缺局面。台积电作为全球领先的晶圆代工厂,其产能早已售罄,订单排期长达数月。英特尔则在努力提升其先进制程的良率,试图通过自研自产来缓解供应链压力。然而,先进制程的良率爬坡是一个缓慢且充满不确定性的过程,短期内难以大规模释放产能。
“台积电售罄,英特尔良率爬坡。”
晶圆制造是CPU生产的核心环节,任何一环的延迟都会导致最终产品的短缺。台积电的产能瓶颈主要源于对先进制程(如3nm、2nm)的巨大需求,而英特尔的良率问题则影响了其高端CPU的供应量。这种供应端的刚性约束,使得CPU市场呈现出明显的供不应求状态,进一步推高了价格和交期。
封装材料:ABF载板引发的连锁短缺
除了晶圆制造,封装材料也成为制约CPU供应的关键因素。ABF(Ajinomoto Build-up Film)载板是高端CPU和GPU封装中不可或缺的材料,其产能扩张速度远跟不上芯片需求的增长。ABF载板的短缺引发了连锁反应,导致即使晶圆生产出来,也无法及时完成封装和测试。
“ABF载板引发的连锁短缺。”
ABF载板的生产技术门槛高,主要供应商有限,产能扩张需要较长的周期。随着CPU和GPU集成度的提高,对ABF载板的需求量大幅增加,导致市场出现严重供不应求。这种材料端的瓶颈,使得CPU的交付周期进一步延长,加剧了市场的焦虑情绪。
AMD:最大受益者,也是最焦虑的受益者
在这场CPU短缺潮中,AMD被视为最大的受益者。其EPYC(霄龙)系列服务器CPU凭借高性能和高能效比,赢得了大量市场份额。然而,AMD也是“最焦虑”的受益者,因为其产能高度依赖台积电,且自身在封装测试环节的能力相对有限。
“AMD:最大受益者,也是最焦虑的受益者。”
AMD的快速增长使其面临巨大的交付压力,任何供应链的波动都会对其业务产生重大影响。为了应对这一挑战,AMD正在积极寻求与更多代工厂和封装厂合作,以分散风险。这种焦虑感促使AMD在供应链布局上更加激进,但也增加了其运营的不确定性。
英特尔:加价30亿美元买回产能控制权
为了应对供应链危机,英特尔采取了激进的策略:加价30亿美元买回产能控制权。这一举措旨在确保其高端CPU的优先供应,减少对外部代工厂的依赖。通过增加资本支出,英特尔试图在晶圆制造和封装测试环节建立更强的自主可控能力。
“英特尔:加价30亿美元买回产能控制权。”
这一巨额投资反映了英特尔对CPU市场长期增长的信心,也显示出其在供应链安全上的紧迫感。通过买回产能,英特尔希望能够缩短交付周期,稳定价格,从而在激烈的市场竞争中保持优势。然而,这一策略也带来了巨大的财务压力,需要长期回报来支撑。
英伟达与Arm:CPU市场的新入局者
随着CPU价值的重估,英伟达和Arm也加入了这场竞争。英伟达通过收购和自研,逐步进入CPU市场,试图打造全栈AI基础设施。Arm则凭借其低功耗和高能效的优势,在服务器和边缘计算领域 gaining traction。
“英伟达与Arm:CPU市场的新入局者。”
英伟达的GPU-CPU协同架构,使其在AI加速领域具有独特优势;而Arm的开放授权模式,则吸引了大量厂商加入其生态。这两家巨头的入局,打破了传统x86架构的垄断,为CPU市场带来了新的竞争格局和创新动力。
残次品也有人抢,芯片短缺潮将持续多久
目前的短缺程度之深,以至于连残次品芯片也有人抢。这表明市场需求已经远远超过了正常供给能力,市场处于极度紧张状态。分析师预测,这一短缺潮可能持续数月甚至更久,直到供应链瓶颈得到缓解,或者需求端出现显著降温。
“残次品也有人抢,芯片短缺潮将持续多久?”
这一现象反映了AI基础设施建设的紧迫性,以及企业对算力资源的极度渴求。短期内的供需失衡,可能推动CPU价格的长期高位运行,并促使各大厂商加速产能扩张和技术创新。这场短缺不仅是周期的波动,更是AI时代算力需求结构性变化的体现。