国泰海通:NPU+3DDRAM或成端侧AI下一代技术趋势 推荐兆易创新(603986.SH)

来源:智通财经 2025-05-27 16:05:07
关注证券之星官方微博:

(原标题:国泰海通:NPU+3DDRAM或成端侧AI下一代技术趋势 推荐兆易创新(603986.SH))

智通财经APP获悉,国泰海通发布研报称,DRAM制程微缩放缓背景下,3D架构转型与NPU协处理器结合将成为端侧AI发展的关键技术路径。研报指出,当前AI端侧推理速度的瓶颈在于内存带宽而非算力,而3DDRAM通过混合键合技术可显著提升传输效率(如800GB/s带宽下高通骁龙8GEN3的推理速度可从4.8 tokens/s跃升至57 tokens/s)。NPU作为协处理器的运用叠加3DDRAM极有可能是下一代的端侧技术趋势,给予行业“增持”评级,推荐兆易创新(603986.SH)。

国泰海通主要观点如下:

DRAM制程微缩放缓,长远命题在于从2D转向3D架构

随着DRAM制程节点不断缩小,目前DRAM芯片工艺已经突破到了10nm级别。工艺完整性、成本、电容器漏电和干扰、传感裕度等方面的挑战愈发明显,要在更小的空间内实现稳定的电荷存储和读写操作变得日益困难。随着DRAM芯片制程愈发先进,长远命题在于从2D转向3D架构;混合键合方案改进了Micro bump的堆叠高度限制等问题,代表3DDRAM未来技术路径。从技术差异上来说,WoW 3DDRAM与CUBE及现有的HBM方案主要差异在于键合方式分别为混合键合与Micro bump。与已广泛使用的Micro Bump堆叠技术相比,混合键合不配置凸块,可容纳较多堆叠层数,也能容纳较厚的晶粒厚度,以改善翘曲问题。使用混合键合方案的芯片传输速度较快,散热效果也较好。考虑到堆叠高度限制、IO密度、散热等要求,三大HBM原厂已确定于HBM520hi世代使用HybridBonding。

AI应用目前在走向百花齐放,而不是高度范化的统一模型

硬件侧在为应用的落地酝酿很多新技术储备,这些机会更加重要。MOE模型开始驱动小的大模型,小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B的10%,表现更胜一筹,激活10%参数量却能超过满血模型,也为端侧应用提供了模型基础。该行认为,海外硬件大厂在储备能让AI“泛在”与“常开”的技术,NPU作为协处理器的运用叠加3DDRAM极有可能是下一代的端侧技术趋势。

当前AI端侧推理速度的主要瓶颈在内存带宽而非算力,内存限制问题由3DDRAM解决

以高通骁龙8GEN3为例,其NPU算力约45 TOPs,内存带宽约为67 GB/s,若运行7B大模型,代入前述公式得到计算能力限制约3215 tokens/s,内存带宽限制约4.8 tokens/s,最终速度取两者中的最小值,确保实际推理不受硬件瓶颈限制,而其内存限制瓶颈明显远大于计算限制。DRAM+NPU通过HB堆叠的形式合封,该行假设以800 GB/s的内存带宽代入上述高通骁龙8GEN3的问题,内存限制将提升至57 tokens/s。中国大陆玩家兆易创新及其投资子公司青耘科技、光羽芯成,以及中国台湾存储IDM华邦电、手机AP龙头高通等,均发力3DDRAM+NPU方案,技术趋势明确。

风险提示:AI应用渗透不及预期;3DDRAM技术发展不及预期。

fund

微信
扫描二维码
关注
证券之星微信
APP下载
好投资评级:
好价格评级:
证券之星估值分析提示国泰海通行业内竞争力的护城河较差,盈利能力一般,营收成长性良好,综合基本面各维度看,股价偏高。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-