kaiyun 黄仁勋的下一座金矿，藏在 CPU 里

来源：未知作者：admin 发布时间：2026-06-07 16:25 浏览：79

夙昔三年，GPU 确切承包了所关系于 AI 基础要领的遐想。

英伟达的市值、云厂商的成本开支、模子公司的锻练节律，终末王人被折算成吞并个问题：谁能拿到更多 GPU，谁就更接近下一轮 AI 竞赛的入场券。

但在刚夙昔不久的 2026 年 COMPUTEX 主题演讲的舞台上，英伟达首创东谈主黄仁勋讲出的新故事，依然不单围绕 GPU 伸开。

他一边推露面向个东谈主 Agent 的 RTX Spark 处理器，把 PC 从「翻开哄骗」再行界说成「建议需求、电脑扩充」的新修复；另一边，又把英伟达第一颗自研数据中心 CPU Vera 推到台前，称它将成为新的主要增长能源，并指向一个 2000 亿好意思元鸿沟的 CPU 阛阓。

百家乐2026世界杯中国官方下载

究其原因，伴跟着 Agent 波浪的到来，只堆 GPU，依然不够了。GPU 仍然自在最中枢的模子推理，但每一次推理前后，王人需要 CPU 处理编排、相易、用具调用和数据流动。

CPU，正在酿成 AI 基础要领的新焦点。

CPU，正杀回 AI 算力的牌桌

CPU 需求回升，领先来自 AI 哄骗模式的变化。

生成式 AI 爆发早期，行业要点确切王人在模子锻练上。锻练要处理海量并行矩阵策划，这是 GPU 的缔结。CPU 主要自在系统启动化、数据搬运、任务管制等接济责任。

于是夙昔几年，「重 GPU、轻 CPU」确切成了行业共鸣。但跟着 AI 从大模子锻练走向大鸿沟推理，再进一步投入智能体期间，责任负载的性质开头变了。

智能体不是「问一句、答一句」的线性系统。它会把一个复杂任务分红多个门径，调用外部用具，读写数据库，扩充搜索，运行代码，处理权限考证，管制落魄文缓存，再判断刻下规矩是否有用，并决定后续看成。

图片由 AI 生成，仅供参考

一个用户申请，可能同期触发几十个致使上百个子智能体并行责任。这些编排、用具调用、内存管制，以及子智能体之间的融合，主要不在 GPU 上完成。

GPU 仍然不错自在模子推理，也即是最接近「想考」的那一步。但在两次推理之间，CPU 要默契模子输出，判断接下来该调用哪个用具，管制扩充筹算，处理文献读写，发起网罗申请，再把规矩再行交给 GPU。

英特尔一位副总裁曾用一个比方表现：智能体责任流本体上是一组独处智能体的合营。几十上百个智能体要互重复信，博亚体育app官方网站就需要不同的「位置」来运行，而这些位置指的即是 CPU。

估量数据也相沿这一判断。佐治亚理工与英特尔在 2025 年 11 月的一篇论文中指出，在智能体责任负载中，CPU 上的用具处理要害占总蔓延的 50% 到 90%。

也即是说，许多时辰确切让用户恭候的不是 GPU 本人，而是 GPU 在恭候 CPU 完成用具调用、数据处理和任务安排，再把下一批输入送过来。

汇丰证券估量敷陈则给出另一个角度：在当代智能体责任流中，约 44% 的底层策划任务高度依赖 CPU，是传统文本生成模子的三到四倍。

夙昔，AI 工作器时时接管「一两颗 CPU 搭配八颗顶级 GPU」的建立，但跟着 AI 责任负载从锻练转向推理，再进一步走向智能体，CPU 与 GPU 配比正从 1:8 变为 1:4，异日可能 1:1 致使更高。

AI 抢完 GPU，还要抢 CPU

AMD 董事长兼 CEO 苏姿丰在多个时事强调，业界此前低估了 CPU 在 AI 期间的价值。

在她看来，仅数据中心阛阓，异日三到四年鸿沟就可能提升 1 万亿好意思元，而这个阛阓需要 CPU、GPU、ASIC 等多种技巧并存。

然则，六到十二个月前，开云体育(中国)官方网站阛阓还很少商讨 CPU，也没东谈主觉得 CPU 会病笃。但跟着推理需求上升，CPU 再行回到舞台中央。在她看来，异日五年，数据中心 CPU 阛阓的年复合增长率将提升 35%，远高于夙昔几年个位数的增速。

居品上，AMD 把重点放在代号 Venice 的第六代 EPYC 处理器上。

这款居品是行业首个在台积电 2 纳米工艺节点上投入量产爬坡阶段的高性能策划芯片。后续繁衍型号 Verano 还将引入 LPDDR 内存集成技巧，有利应付智能体带来的大容量内存需求。

在第六代 EPYC 全面铺开前，AMD 第五代 EPYC 依然凭借高中枢密度和能效比站稳阛阓。财报数据炫夸，2025 年第四季度，AMD 数据中心业务营收达到创记载的 54 亿好意思元，同比增长 39%。

英伟达的逻辑则稍许不同。

英伟达想的则是让自家最佳的 GPU 不被外部组件拖慢。比起与英特尔、AMD 打价钱战，确切的算盘是消以外部 CPU、PCIe 总线和低速网罗对 GPU 效果的牵涉，把 CPU 内化成自家迥殊 AI 平台的一块拼图。

顺着这个想路，英伟达拿出了首款定制 CPU Vera，专为 agentic AI 的编排、用具调用和长落魄文管制遐想，黄仁勋还把它定位成公司下一个数十亿好意思元级的业务，并预测 Vera 将让英伟达投入一个 2000 亿好意思元的 CPU 阛阓。

最近，英伟达超大鸿沟与高性能策划副总裁 Ian Buck 也将首批英伟达 Vera CPU 系统请托至 Anthropic、OpenAI、Oracle Cloud Infrastructure 以及 SpaceXAI。

参数炫夸，Vera 搭载 88 个英伟达自研 Olympus 中枢，兼容 Armv9.2 教唆集，并在 CPU 层面原生相沿 FP8 精度运算。

为了处治传统超线程可能带来的性能波动，Vera 接管空间多线程技巧，在物理层濒临中枢资源作念硬分区，提供 176 个硬件线程，让每个线程在处理复杂逻辑分支时取得更踏实的尾部蔓延发达。

而吃到这波 CPU 红利的，还有昔日霸主英特尔。财报炫夸，英特尔一季度（Q1 2026）营收为 136 亿好意思元，同比增长 7%，净利润同比暴增 156%。

英特尔 CEO 陈立武示意，基于 Intel 3 的至强 6 居品和基于 Intel 18A 的酷睿系列 3 居品已全面投入量产爬坡阶段，但他也示意，英特尔尚未能十足知足阛阓需求，增长势头展望将抓续到来岁。

濒临 CPU 阛阓需求的暴涨，总共 AI 产业链正在投入一场围绕先进制程产能的争夺。

亚马逊、微软等超大鸿沟云厂商，以及苹果、英伟达、AMD 等芯片遐想巨头，王人在争夺有限的代工窗口。不外，在这场竞争中，利润率更高、芯单方面积更大的数据中心 GPU 订单，依旧在挤压通用 CPU 的坐褥配额。

在本就吃紧的 CPU 产能里，芯片厂会优先知足利润更高的工作器订单，病笃也起初在工作器 CPU 这一端泄漏，并传导到价钱和交期上。

英特尔已向中国客户预警，部分工作器 CPU 的请托周期长达六个月；AMD 部分居品的交期也延长到八到十周。英特尔在中国阛阓的工作器芯片价钱高涨提升一成，而中国阛阓占其总营收两成以上。

与此同期，全球内存严重贫穷又带来提前囤货效应。客户为了锁定整机系统价钱，纷繁提前采购 CPU，使底本病笃的供给愈加吃紧。

工作器这边吃掉了大部分产能，代价就传递到了阔绰端。面向个东谈主和庸碌企业阛阓的 CPU 坐褥线被排到后头，巨匠阛阓供应随之趋紧、价钱上行，出价更高的大客户优先拿货，庸碌采购方只可列队。换句话说，AI 越火，你的下一部电脑很可能就越贵。

简言之，AI 算力彭胀带来的压力，正在沿着工作器产业链向外扩散：GPU 、CPU、内存、DPU、高带宽网罗交换机、先进封装、液冷散热、整机柜供电，任何一个要害跟不上，王人会影响最终的算力请托。

AGI 无法逃离基础要领的地心引力，它仅仅绕了一大圈，又回到了最朴素、却最有杀伤力的履行中：先有远大的能源kaiyun，再有精密的机器系统，终末，才有可能出生确切的智能。