ARM的AI叙事:AGI路径与CPU复兴

日期:2026-03-26 15:22:21 / 人气:9



文 / 技术观察者

在AI的世界里,GPU曾一度吞噬一切。但随着大模型从单纯的“生成”走向复杂的“智能体(Agentic)”,那些曾被边缘化的角色——CPU,正重新成为系统瓶颈。正如黄仁勋反复强调的那样,CPU已经成为限制英伟达“AI工厂”吞吐token速度的关键所在。

现在,长期坚持身居幕后的Arm公司,终于决定亲自下场。其首款面向外部销售的数据中心CPU被直接命名为Arm AGI CPU,野心昭然若揭。

直斥x86为“技术债务”

这款芯片的发布,不仅是一次产品的更新,更是对现有格局的挑战。在发布会上,Arm高管毫不客气地直斥x86架构是AGI路线的技术债务。

根据官方资料,Arm AGI CPU拥有136个Neoverse V3核心,最高主频3.7GHz,采用台积电3nm工艺由两个Chiplet组合而成。每个核心配备2MB L2缓存,共享128MB系统级缓存(SLC),内存带宽高达825 GB/s,TDP设计为300W。

这一规格已经全面超越了英伟达目前主打的Grace CPU(基于ARM Neoverse V2核心)。面对如此强悍的参数,Meta与OpenAI等原本围绕AI推理芯片构建体系的玩家,开始为CPU预留位置;就连叫板英伟达的芯片初创企业Cerebras,也成为了它的客户。

智能体式AI的兴起,为CPU带来了新的价值。 Arm CEO Rene Haas预测,随着AI演进到智能体模式,数据中心对CPU的需求可能增长四倍,相当于每GW算力的CPU核心数将从3000万个跃升至1.2亿个。相比传统x86,AGI CPU能省下高达100亿美元/GW的电费和资本支出。

避免GPU价值的“空转”

能省电费固然重要,但CPU复兴的核心逻辑在于:避免GPU价值的浪费。

随着GPU算力日益强大,其空闲或未充分利用的成本已不可接受。在AI工厂中,吞吐token的交互速度若从每秒400个提升至1000个,每百万token的价格可从45美元跃升至150美元——这是一种非线性的价值增长。

在GTC 2026期间,黄仁勋接受专访时坦承,英伟达专注于加速计算,目标从来不是取代CPU,而是最大化整个系统的性能。在现代AI系统中,系统性能始终受阿姆达尔定律制约,GPU、网络、内存和CPU都会成为潜在瓶颈。

过去十年,CPU设计主要围绕超大规模云计算展开(Cloud-Native CPU),强调核心数量。而在智能体兴起前,CPU主要作为GPU的控制节点(Head Node),负责管理和喂数据,对单核性能要求不高。

然而,随着智能体能力增强,它需要处理数据调度、任务编排、工具调用,甚至操作没有API接口的应用程序(如浏览网页、点击界面)。一旦CPU性能不足,这部分“不可加速”的工作就会成为整个系统的阿喀琉斯之踵。

英伟达的反击:Vera与Rosa

既然AGI离不开CPU,黄仁勋自然希望将CPU的命运牢牢抓在自己手里。

在上周的GTC 2026上,英伟达大力宣传了下一代基于Arm架构的自研CPU。它摆脱了ARM的Neoverse核心,采用了深度自研的Olympus核心,号称单核性能最强。该CPU的每核私有L2缓存提升至2MB,内存带宽更是达到了惊人的1.2TB/s。

这就是英伟达的Vera CPU,而其下一代Rosa CPU也已早早宣布。尽管黄仁勋在台上为ARM AGI CPU美言了几句,但双方的竞合关系正变得微妙。

回想2020年,英伟达曾动过400亿美元收购ARM的念头,最终在监管压力下告吹。如今,为了打破“阿姆达尔瓶颈”,英伟达收购了Mellanox与Groq,并在去年推出NVLink Fusion功能,允许非英伟达的CPU或GPU互联互通——这或许正是预见到了CPU复兴的这一刻。

群雄逐鹿:云巨头的自研之路

事实上,英伟达早已开始出售自己的CPU。今年2月,英伟达与Meta达成多年协议,首次大规模部署Grace CPU,而下一代Vera CPU也在接受Meta评估。

值得注意的是,Meta正是ARM AGI CPU的首位大客户,也是其设计合作者。 在硅谷巨头中,Meta在CPU自研布局上相对落后,而亚马逊、微软、谷歌早已行动:

•   亚马逊AWS:2018年首发Graviton,目前最新的Graviton5将驱动基于Trainium3的算力集群。

•   微软Azure:推出了Cobalt系列,但目前基于Maia 200的集群仍由Intel CPU驱动。

•   谷歌云:推出了Axion系列,覆盖约30%的内部应用,未来计划设计用于TPU集群的Axion CPU以支撑Gemini模型。

不过,目前这些自研CPU大多仍处于“GPU控制节点”的阶段,尚未完全转向为智能体式AI深度优化。

结语

智能体正在改变AI叙事的竞争格局。

ARM AGI CPU是CPU复兴的第一声枪响,它试图打破x86的垄断,重构数据中心的成本模型。而英伟达则以Vera CPU和NVLink Fusion构筑防线,试图在保留选择权的前提下,继续掌控“AI工厂”的全栈节奏。

正如推理时代AI芯片走向定制,智能体时代的CPU复兴,谁都想掺和一把。因为这不再仅仅是服务器市场的争夺,而是关于谁能定义AGI实现路径的终极博弈。

作者:杏鑫娱乐




现在致电 8888910 OR 查看更多联系方式 →

COPYRIGHT 杏鑫娱乐 版权所有