logo
国金证券Agent对CPU刚性需求 产业已进入新一轮景气周期
== 2026/5/18 4:37:09 == 热度 188
发布研报称,随着大模型从Chatbot向Agent演进,计算负载重心正发生偏移。Agent不仅需要GPU进行模型推理,更依赖高性能CPU处理复杂逻辑编排、工具调用与内存管理。伴随Agent数量、任务复杂度与Token消耗指数级增长,CPU产业已进入新一轮景气,Intel、AMD服务器CPU库存趋紧、交期延长,并于2026年以来持续推进涨价。主要观点如下:Agent对CPU刚性需求,CPU重回核心地位随着大模型从Chatbot向Agent演进,计算负载重心正发生偏移。Agent不仅需要GPU进行模型推理,更依赖高性能CPU处理复杂逻辑编排、工具调用与内存管理。认为,Agent对CPU的刚性需求主要来自三方面:1)Multi-Agent架构带来的OS调度压力,以及沙盒环境创建、调度与销毁对CPU算力的持续消耗;2)长上下文场景下KV Cache卸载对CPU内存与带宽提出更高要求;3)高并发工具调用带来的大量CPU算力消耗。Intel论文显示,多数Agent工作负载中,CPU耗时占端到端延迟比例可达40%-90%。认为,伴随Agent数量、任务复杂度与Token消耗指数级增长,CPU产业已进入新一轮景气,Intel、AMD服务器CPU库存趋紧、交期延长,并于2026年以来持续推进涨价。CPU TAM扩容,CPU/GPU部署比例抬升1)TAM来看,AMD与Arm均大幅上修服务器CPU市场空间,预计2030年全球服务器CPU TAM将超过1000亿美元。根据AMD,CPU需求可分为通用计算CPU、AI头节点CPU以及Agentic AI CPU三部分,其中智能体AI相关需求是最大的增量来源。2)配比来看,AI数据中心CPU/GPU部署比例正从传统HGX时代的1:4、1:8,逐步向1:2、1:1甚至更高演进。以NVIDIA为例,GB300NVL72已实现72颗GPU搭配36颗Grace CPU的1:2配比,Vera Rubin进一步通过外挂独立Vera CPU机柜,使整体CPU配比继续抬升。所有CPU架构均受益,ARM中期变化更显著1)ARM架构低功耗、高核心密度的特性更契合Agent工作负载。相比x86,ARM在高并发、低功耗场景下具备更优能效比与扩展能力,尤其适合海量API调用、KV Cache调度等轻计算、高并发任务。2)ARM开放授权生态亦高度契合云厂商自主构建AI基础
=*=*=*=*=*=
当前为第1/2页
下一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页