
智能体真正大规模落地之前,你觉得现在芯片厂商对 AI 算力需求的预测,是太乐观还是刚刚好?
过去几年,只要谈到 AI 算力,话题几乎被 GPU 和各种加速器全包了。但在 6 月 5 日英特尔至强 6+ 新品发布会暨数据中心创新日上,英特尔全球副总裁兼首席市场营销官 Brett Hannath 用了一个挺形象的比喻,他说在一场工作负载的交响乐里,GPU 是台前那个炫技的独奏,而 CPU 是站在指挥台上的乐团指挥,负责统筹编排、调度协调、全面把控。
这场发布会想讲的核心其实就一句话,当 AI 从训练走向推理、从单轮对话走向智能体,CPU 正在被重新请回数据中心的中心位置。 英特尔为此拿出的主角,是一颗最高 288 核、用上自家 18A 制程的至强 6+ 处理器。
但听完整场,我更想先把视角拉远一点。这其实是一件很早期的事。 现在从显卡到 CPU、从内存到整机,几乎所有芯片厂商都在满负荷运转,大家都在用过去这段高增长、高需求的态势,去预测后面几年的市场。可一旦真正落到至强 6+ 这样的产品、落到数据中心的产业层面,智能体大规模落地这件事其实还没真正开始。客户画像、市场规模、谁会怎么买,目前都还看不到具体可估的数字。所以这篇文章,我想先讲清楚这颗芯片是什么、它背后的产业逻辑在变什么,至于那个还没成形的市场,不妨先按下不表。
一颗 288 核的芯片,和它想接住的那个新需求
先说产品本身。这次发布的至强 6+,代号 Clearwater Forest,最值得说的有两点。一是核心密度,它在业界拥有最高的核心密度,最高可达 288 个能效核,配 576MB 的末级缓存,这个缓存容量比上一代提升了 5 倍以上,还支持高达 8000MT/s 的 DDR5 内存。二是制程,它是英特尔第一款基于 18A 制程打造的数据中心 CPU。
18A 这件事,对英特尔的分量不只在性能。过去几年英特尔在制程上栽过不少跟头,18A 一度更像是路线图上的一句承诺。而这次至强 6+ 不仅用上了 18A,还在发布当天就通过戴尔、HPE、联想、超微这些一线服务器厂商出货。换句话说,这是英特尔第一次拿出一款基于自家最先进制程、并且真的能买到的数据中心硬件。 按英特尔自己的官方对比,旗舰型号至强 6990E+ 相比 AMD 的 192 核 EPYC 9965,每线程性能平均高出约 30%,能效也高出约 30%。这个数字来自英特尔的第一方测试,参考时可以留个心眼。
至于这颗芯片为什么是 288 个能效核,逻辑要回到它想接住的那个新需求上。
英特尔数据中心集团产品总监 Kira Boyko 在台上讲了一个判断,传统 AI 推理是被动的、单轮的,给一个答案就结束了,主要靠算力驱动。而智能体 AI 从根本上变了,它是主动的、自主的、以目标为导向的,会一直处在感知、规划、执行、优化的循环里,要拆解复杂任务、调用工具、执行代码、协调多个智能体,还得维持长周期的上下文记忆。
她说,这些活儿的关键在于,它们需要运行海量并发、多步骤的工作流,而这些本质上是高度吃 CPU 的,涵盖跨域编排、工具执行和上下文处理这些环节。主导需求已经不只是单纯的浮点运算能力,而是编排、并发和高效执行。所以一颗为智能体设计的 CPU,要的就是超高的核心密度,好让大量智能体能并行地跑起来。
这套说法在合作伙伴那里得到了呼应。金山云计算研发负责人杨峰讲得更直白,他说在智能体时代,CPU 从辅助配角变成了系统的核心,因为 Agent 在思考任务怎么执行、怎么决策,提交给 GPU 的所有任务都先经过它,CPU 实际上成了那个指挥者和大脑。英特尔数据中心集团副总裁、中国区总经理陈葆立则给了一个更具体的密度数字,基于至强 6+,每个处理器核心可以运行四个智能体,单颗处理器就能支持超过 1000 个智能体的稳定部署。
落到机柜级别,发布会上展示的一个全液冷机柜,CPU 核心密度可以做到 46080 核,单机柜就能运行数以万计的智能体应用。
CPU 和 GPU 的配比,正在从 1 比 8 走向 1 比 1
如果说第一条线讲的是产品,那么第二条线讲的是产业里正在发生的一个结构性变化,而这恰恰是这颗芯片能立住的真正前提。
英特尔市场营销集团副总裁、中国区总经理郭威在台上抛出了一个观察。他说从去年下半年开始,就不断有人问他,为什么 CPU 开始有点缺货,什么时候能好转。在他看来,这背后是智能体 AI、物理 AI 和强化学习的发展,大幅催生了 CPU 的需求。
更能说明问题的是一个配比的变化。郭威提到,原来在大模型场景里,CPU 和 GPU 的配比大概是 1 比 8,后来变成 1 比 4,而现在第三方机构调查到的对比已经到了 1 比 2,未来 CPU 的比例还会更高。英特尔在新闻稿里把这个趋势说得更明确,随着智能体时代到来,这个配比会逐步走向 1 比 1。
这个判断不是英特尔一家的自说自话。从公开信息看,整个行业的信号是一致的。英特尔在今年第一季度的财报电话会上就提到,随着 AI 工作负载从训练转向推理,数据中心里 CPU 和 GPU 的部署配比可能在智能体场景下收紧到 1 比 1。AMD 的 CEO 苏姿丰最近也说,全球 CPU 市场很紧张,主要是被 AI 推理和智能体 AI 超预期的需求拉动,AMD 正在和台湾的合作伙伴一起扩产能。也就是说,CPU 在 AI 里的角色变重,是这一轮从训练转向推理、转向智能体之后,几家主要厂商共同看到的方向,而不只是英特尔的一个产品故事。
需求一旦回到 CPU,整个数据中心的体系架构也得跟着变。郭威的说法是,原来大家提到 AI 数据中心就是 GPU、超节点,现在 CPU 重新回到中心,CPU、GPU、网络、存储就需要更有机地结合在一起。英特尔这次把这套能力拆成了四个词,算力、存力、连接力、保障力,发布会的大半时间其实都在围绕这四个词,讲它和腾讯云、金山云、阿里云、新华三、火山引擎这些伙伴的联合实践。
这些实践里有一些挺具体的细节。比如腾讯云基于至强能效核自研的星星海服务器,在腾讯会议这样的高峰场景下, 曾经 8 天扩容 100 万核;新华三的 AI 原生存储借助至强处理器, 把单节点带宽做到了 200GB/s;阿里云用上至强新的 QAT 引擎之后, 压缩带宽相比过去软件加速的形态提升了 4 倍, 同时减少了 75% 的通用 CPU 核数。这些数字单看都不错, 但需要说明的是, 它们大多还是厂商在自己特定场景下的实践结果, 离一个能横向比较、能预估规模的成熟市场, 还有距离。
一颗为电信和网络而生的芯片,意外撞上了智能体
把视角从这场发布会拉到整个产业,有两件事可能比 288 核这个数字更值得琢磨。
第一件事,是这颗芯片的来路其实有点意思。按海外科技媒体 The Register 的说法,Clearwater Forest 这一代至强, 最初是为电信网络、SaaS 应用这类高并发的网络规模工作负载设计的, 结果赶上了 OpenClaw 这类智能体框架的兴起。这些框架在完成一个任务时, 会向网络、代码、数据库、各种 API 发出几十甚至上百次请求, 而这些请求全都跑在 CPU 核心上。于是一颗本来面向电信和网络的高密度芯片,有点歪打正着地, 变成了一个适合智能体的产品。 这并不丢人, 芯片设计周期本就以年计, 没有哪家厂商能精准预判到智能体会这么火。但它也提醒我们,今天被反复强调的那套 AI 叙事, 有时是产品先做出来, 需求后长出来, 而不是反过来。
第二件事,也是我看完整场发布会最强烈的感受, 是整个行业现在都处在一种满负荷运转、并且基于当下高增长去外推未来的状态里。 从公开报道看,2026 年以来, 服务器 CPU 的供应普遍吃紧、价格上涨、交期拉长, 英特尔在把产能从消费级芯片往至强这边调,DRAM 价格相比 2025 年初涨了数倍, 甚至有行业分析预测,2026 年规划的数据中心产能里, 会有三到五成要推迟到 2028 年才能落地, 卡点不只在芯片, 还在电力、铜、冷却用的气体这些更现实的东西上。
换句话说, 现在所有人都在用这段需求爆发期的态势, 去预测后面几年的市场, 大家都在抢着布局下一代。但从一颗至强 6+ 真正落到数据中心的产业层、真正支撑起大规模的智能体应用, 这件事其实还没开始。 智能体到底会在多少企业、以什么规模、用什么样的商业模式跑起来, 客户画像和市场规模现在都还是一个很早的状态, 不是一个能看到具体数据、能拿来精确预估的事情。
至强 6+ 是一颗扎实的产品,18A 制程的落地对英特尔本身也是个不小的里程碑,CPU 在 AI 数据中心里变重, 也是几家主要厂商共同验证过的真实方向。这些都没问题。但围绕它的那套"重构智算中心」的宏大叙事, 更像是对一个尚未真正开始的市场, 提前下的一个注。
注下得有没有道理, 可能还得等智能体真正从发布会的 Demo 区, 走进千行百业的机房, 才能见分晓。



