

当地时辰 4 月 9 日,谷歌与英特尔文告扩大多年期合作,中枢内容并非 GPU 采购,而是多代至强(Xeon)处理器的部署承诺,以及基于定制 ASIC 的基础设施处理单位(IPU)结合研发。音问一出,英特尔股价当日上升 4.7%,已往五个来去日累计涨幅约为 22.5%。
并吞天,SemiAnalysis 首席分析师 Dylan Patel 在一场深度访谈中抛出了一个让业界警悟的数据:" 已往六个月,统共这个词云市集的 CPU 齐跑光了。"
供给端的情况在恶化。据 Omdia 证据,全球业绩器 CPU 供应病笃可能导致 2026 年价钱上升 11% 至 15%。汇丰证券更将 2026 年全球业绩器出货量同比增长预期大幅上调至 20%,同期指出受供应链产能驱散,真是市集需求可能高达 60%。
淌若说一年前市集还在争论" AI 是否需要 CPU ",那么当今的问题也曾变成了" CPU 不够用怎么办"。这背后,是一场正在发生的结构性变化:AI 基础设施的瓶颈,正从 GPU 向内存和 CPU 迁徙。对于内存对 AI 基础设施的影响以及市集强烈的反映,全球也曾很熟习了,今天咱们来讲讲 CPU。
PART 01
为什么 CPU 一忽儿变 " 稀缺 " 了?
从 " 问答 " 到 " 任务 ":CPU 责任负载的根底膺惩
判辨这个问题的来源,是 AI 责任负载性质的转变。
在 AI 发展的头几年," 发一个字符串,回一个字符串 ",浅易的文本生成推理,对 CPU 的负载如实很轻。行业不雅察者 Dylan Patel 回忆:" 在 AI 的头几年,CPU 如实严重滞后。负载很轻。你发一个字符串,它回一个字符串,浅易的推理,对 CPU 需求不大。"
但这一地点在已往几个月被透顶摧毁。
中枢驱能源"智能体(Agent,比如各平台的 ' 小龙虾 ')和强化学习(RL)"的爆发。以 OpenAI o1 为代表的新一代模子,不再是浅易的问答输出,而是运行自主实行任务、调用数据库、自我考证。多步推理、多用具调用、多智能体互助,正在成为 AI 责任的新形态。
Dylan Patel 给出了一组极具冲击力的数据:
代码智能体收入:已往 6 个月,从几十亿好意思元暴涨至跳跃 100 亿好意思元
单次任务时长:Claude Code 等智能体可相接责任 6 至 8 个小时,抓续调用数据库、触发种种业绩——这意味着抓续、高强度的 CPU 占用
强化学习检修轮回:模子每生成一步输出,齐需要在 CPU 集群上进行高频考证,轮回越来越邃密
" 遐想一下异日一两年检修的机器东谈主模子——一个视觉讲话模子辞全国模子中导航,试图提起东西、放下东西。每一步齐需要被考证,而物理模子跑在某个 CPU 集群上。那需要的 CPU 量会多得荒诞。"
数据重新佐证 CPU 的责任价值
GPU 是 AI 的完全主角——这个证据树大根深。但 Georgia Tech 与 Intel 结合发布的扣问,正在动摇这个证据。
2025 年 11 月,两家机构结合发布了一篇论文,名为《Characterizing CPU-Induced Slowdowns in Multi-GPU LLM Inference》。扣问的中枢发现是:
在智能体 AI 责任负载中,CPU 瓶颈在多 GPU 推理系统中广泛存在。
具体来说,当企业部署一个多智能体系统(如 AI 扣问助手,需要同期启动子智能体搜索网页、查询数据库、概述文档、编写代码),CPU 不再是旁不雅者,而是骨子承担了气象爱戴、高下文窗口解决(可延长至数十万 token)、用具调用、检索增强生成(RAG)查询、以及后果汇总妥洽等责任。
GPU ——再高大——也在恭候 CPU 喂给它数据、解决 KV 缓存、分发下一个任务。
扣问还发现,即使在接收程度级折柳和 CUDA Graphs 等当代 GPU 优化的推理框架中,CPU 瓶颈依然果断存在。
PART 02
供需失衡:云厂商的 CPU" 库存危急 "
需求在激增,供给却跟不上。
Dylan Patel 显现了一个细节:OpenAI 为了取得 CPU 算力,径直向亚马逊忽视央求—— " 把你的 CPU 给咱们 "。更值得温文的是,OpenAI 的代码栈此前险些只在 x86 CPU 上运行,但亚马逊领有大批 ARM CPU。据 Dylan Patel 显现,OpenAI 的回话是:" 唯独能拿到 CPU,我愉快把统共这个词栈移植已往。"
工程迁徙的代价极高,米兰app官方网站但算力需求也曾贫瘠到让企业愉快付出这种代价。
行业数据相通印证了供需病笃:
亚马逊 CPU 业绩器安设量:本年同比增长 3 倍。
GitHub 踏实性:已往数月不绝出现宕机和提交失败。原因是微软将大批闲置 CPU 分拨给了 Anthropic 和 OpenAI。
CPU 利润率:正在攀升。Intel 和 AMD 均已发出加价见知。
芯片交货周期:从宽泛水平大幅延长,部分型号需要恭候数月。
好意思银(Bank of America)最新瞻望:全球数据中心 CPU 市集规模将从 2025 年的 270 亿好意思元,增长至 2030 年的 600 亿好意思元,险些翻一倍多,且增长险些一起由智能体 AI 需求驱动。
Intel CFO David Zinsner 在摩根士丹利 TMT 会议上走漏:2025 年全年,CPU 市集增长 20%-30%。
PART 03
产业链的四百四病
CPU 厂商:Intel 和 AMD 的 " 有时春天 "
对 Intel 而言,这波 CPU 需求波浪来得恰是时候。
在 AI 芯片市集,Intel 永久处于英伟达的 GPU 主导款式暗影下。但凭借至强(Xeon)处理器家具线,Intel 正在 AI 推理市集找到新的增长锚点。
2026 年 3 月,Intel 发布了至强 6 处理器(代号 Granite Rapids),中枢数据亮眼:
中枢数最高 128 个(较上一代翻倍)
L3 缓存最高 504MB
运行 Llama 2 70B 大模子,性能进步 3.08 倍
引入 FP16 神色的 AMX(高等矩阵推广)加快引擎,挑升优化 AI 推理中最常用的乘累加运算
内存带宽翻倍,支抓 DDR5 6400MT/s 和 MRDIMM 8800MT/s
192 条 PCIe 5.0 通谈(较上一代进步 20%)
每瓦性能进步 1.6 倍,TCO 从简 30%
更值得温文的是,英伟达已采纳制冷 6776P 看成 DGX B300 加快系统的唯独主控 CPU ——这意味着 GPU 巨头在自家旗舰系统中,也需要 Intel CPU 来承担任务调和和数据预处理。
AMD 相通受益。EPYC 系列处理器在云厂商中的接收率抓续进步。但由于台积电产能向 AI 加快器歪斜,AMD 的 CPU 产能相通濒临拘谨。
Arm 也在积极入局。2026 年 3 月,Arm 发布了首款面向数据中心的通用处理器 AGI CPU,136 核,与 Meta 结合开辟。这径直与 Intel 和 AMD 的 x86 架构酿成竞争。
云厂商:重新想考 " 算力配比 "
传统的 AI 集群架构中,CPU 与 GPU 的配比约莫是 1:100(100 兆瓦 GPU 对应约 1 兆瓦以至更少的 CPU)。但这个比例正在急巨变化。
Dylan Patel 指出:" 以前,每个 CPU 业绩器对应好多 GPU 业绩器。但当今这个比例正在变得畸形接近,不管是对于 RL 检修如故推理(智能体推理)。"
这意味着云厂商在盘算 AI 基础设施时,不成再只盯着 GPU 采购—— CPU 容量相通需要被纳入中枢盘算。
定制芯片波浪:IPU 成为新战场
在 CPU 和 GPU 以外,"基础设施处理单位(IPU)"正在成为云厂商的新焦点。
IPU 挑升采纳会聚流量路由、存储解决、安全加密等 " 后台任务 ",将主 CPU 从这些责任中自若出来,让更多算力留给用户负载。
谷歌与 Intel 扩大合作的中枢内容之一,恰是基于定制 ASIC 的 IPU 结合研发。谷歌的标的很明确:为自家云数据中心定制专属的 IPU,杀青更高效的资源调和。
PART 04
写在终末
英特尔和谷歌共同文告扩大多年期的计谋合作,对于英特尔来说,在 AMD 紧逼、ARM 浸透的竞争款式下,取得谷歌这么级别的客户背书,无疑是一针强心剂。更首要的是,这份合作向行业开释了一个信号:在 AI 期间,CPU 不是要被替代的旧技艺,而是统共这个词基础设施的中枢因循。
虽然,这轮价值重估的抓续性还取决于几个要津变量。
第一,需求的抓续性。 现时 CPU 需求主要由 AI 推理和智能体 AI 驱动。汇丰合计 AI 驱动的增长红利可能抓续至 2028 年,但推理责任负载能否保抓现时增速,将径直影响 CPU 市集的永久需求弧线。淌若智能体 AI 的普及速率超出预期,CPU 需求的增长弧线可能会比现时瞻望更为笔陡;反之,淌若 AI 推理资本的快速下落导致推理向终局诞生迁徙,数据中心侧的 CPU 需求增速也可能放缓。
第二,供应侧的反映速率。 英特尔正在治愈产能分拨,优先保险数据中心 CPU 供应,但新产能的开释需要时辰。台积电先进制程的产能瓶颈短期内难以缓解,CPU 供应病笃的地点可能还会抓续一段时辰。
第三,竞争款式的演变。 AMD 能否在业绩器 CPU 市集进一步扩大份额?ARM 阵营的浸透速率是否会超出预期?英特尔能否借助至强 6 系列扭转份额下滑的趋势?云厂商的自研趋势——谷歌、亚马逊、微软齐在积极自研芯片,Counterpoint 瞻望到 2029 年 ARM 架构 CPU 在定制化 AI ASIC 业绩器中的占比至少达 90% ——会不会减弱传统 CPU 厂商的市集空间?这些问题的谜底将在异日一到两年内缓缓开畅。
从面前的不雅察来看米兰app官网版,英特尔在中枢数和制程上的追逐能否回荡为市集份额的止跌,是异日两个季度最值得温文的标的。
ag真人app官方网站入口