首页 - 股票 - 研报 - 行业研究 - 正文

半导体行业深度报告:Agentic AI时代的算力重构:CPU,从“旁观者”到“总指挥”的价值回归

(以下内容从东吴证券《半导体行业深度报告:Agentic AI时代的算力重构:CPU,从“旁观者”到“总指挥”的价值回归》研报附件原文摘录)
投资要点
从对话模型到行动智能体:Agent架构重塑CPU与GPU分工:市场认为AI算力=GPU,CPU只是负责调度。但AI落地方向来到Agent,由“纯对话”转向“执行任务”时,算力需求发生了结构性分化。1)执行控制流CPU化:Agent的行动阶段是大量if/else判断与系统调用。Manus等主流Agent架构为每个Agent/任务分配一个隔离的云端虚拟机,不同任务在逻辑上高度异构(如网页浏览、代码修改、环境部署等),任务之间可并行但控制流完全不同。分支类任务不适合由GPU执行,因控制流发散导致算力利用率急剧下降。而分支类任务却正是CPU微架构长期优化的主战场。2)记忆体系去GPU化:在Agent场景下,长上下文推理会产生巨大的KV cache,其占用随对话轮次与上下文长度线性增长,快速耗尽GPU HBM容量。而CPU搭配大容量DDR5/LPDDR5(并通过CXL扩展)承载KV Cache与部分参数,正在成为兼顾吞吐、扩展性与成本效率的主流架构选择。
Agent软件基础设施加速落地,CPU多核化与需求放量进入确定性通道:从实验数据复盘来看,CPU成为Agentic AI的真实瓶颈。研究显示,在完整的Agent执行链路中,工具处理相关环节(检索、Python/Bash执行、Web请求等)在CPU上消耗的时间占端到端延迟的比例最高可达90.6%。在高并发场景下(Batch Size提升至128),CPU端到端延迟从2.9秒跃升至6.3秒以上。我们认为研究结果揭示了在大量Agentic场景中,系统吞吐受限的并非GPU计算能力,而是CPU的核心数并发调度问题。我们由此判断,进入Agent时代后,CPU侧的工具执行与调度能力将从GPU的附属角色,演化为需要被单独规划与优化的核心资源池。
产业端推进方面,AWS和Google Cloud等头部CSP正在加速建设面向Agent的沙盒环境软硬件基础设施,率先在软件层面强化Agent Sandbox的隔离与编排能力,通过运行时与调度体系的完善,为后续CPU侧基础设施规模化部署奠定基础。与此同时,CPU龙头也在Agent驱动下向超多核架构演进:AMD推出的Turin最高可达192核;Intel的SierraForest采用纯能效核设计,核心数可达144甚至288核。我们认为,随着Agent商业化推进,厂商必须持续压低每次任务执行成本。在这一目标下,超多核CPU以更高的并行度、更低的单位功耗,支撑大规模、长期运行的Agent执行环境。英伟达亦在新架构中提升CPU配比,CPU的重要性抬升,挂钩Agentic的叙事。我们认为NVIDIA主动提升CPU权重,等同于在系统层面确认:在长上下文与高并发Agent场景中,大内存CPU是承载海量KV Cache的最优容器。
投资建议:我们看好海光信息与澜起科技,前者受益于Agentic AI推动CPU从调度走向高并发执行的核心算力地位抬升,后者受益于长上下文与高并发场景下CXL驱动的“存力+算力”协同升级。建议关注龙芯中科,万通发展(数渡科技)。
风险提示:Agent落地节奏不及预期风险;新型硬件架构替代风险;CSP资本开支波动风险。





fund

APP下载
广告
好投资评级:
好价格评级:
证券之星估值分析提示万通发展行业内竞争力的护城河良好,盈利能力较差,营收成长性一般,综合基本面各维度看,股价偏高。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-