(以下内容从开源证券《电子行业点评报告:Vera Rubin NVL72推出,六芯协同架构重塑AI算力基建》研报附件原文摘录)
NVIDIA Rubin平台亮相CES,协同设计打造最强AI超算
1月6日,黄仁勋在CES上展示了NVIDIA首个采用极致协同设计的AI平台Rubin。通过对Vera CPU、Rubin GPU、NVLink6交换机、ConnectX9SuperNIC、BlueField4DPU和Spectrum6以太网交换机六款芯片进行极致协同设计,大幅缩短训练时间并降低推理token成本。其机柜级解决方案Rubin NVL72不仅实现了性能的倍数级提升,更在架构设计上完成了颠覆性革新。
Rubin NVL72机柜级解决方案六芯协同实现性能与成本的飞跃
Rubin NVL72机架级系统通过无缆互联架构整合18个计算托盘(每托盘集成2个Vera CPU与4块Rubin GPU的Superchip,共72GPU与36CPU)与9个NVLink6交换托盘。计算层依托NVLink-C2C实现1.8TB/s CPU-GPU互联,HBM4显存提供单GPU288GB容量与22TB/s带宽。网络层以NVLink6交换机达成GPU间3.6TB/s全互联Scale-up,结合Spectrum-X CPO交换机(512×200Gbps)实现Scale-out扩展,BlueField-4DPU统筹管理、安全与存储卸载,并集成150TBNAND上下文存储池(每GPU分配16TB)。辅助层采用全覆盖液冷系统与机架级机密计算、RAS引擎,通过模块化无线缆托盘设计优化维护效率。
高带宽,无缆化,高拓展性,深度互联多向升级重塑AI算力基建
Rubin NVL72机架级系统的创新趋势呈现五大核心方向:极致带宽、易维护性、高效扩展性、深度协同和安全性。(1)高带宽:在Scale-up层面,第六代NVLink技术使单GPU带宽和机柜总带宽均实现翻倍,支撑超大规模模型协同计算,而非松散耦合的集群。(2)无缆化:物理连接形态上,采用Cable-Free无缆托盘与高密度Midplane背板设计,降低对线缆的依赖度,同时采用热插拔,实现系统运行时的故障组件直接更换,大幅提升装配及维护效率。(3)高拓展性:Scale-out扩展性方面,以CPO技术替代可插拔光模块,显著提升能效,实现横向扩展和跨区域扩展。(4)深度互联:CPU与GPU通过NVLink-C2C实现超高速互联,消除PCIe总线的带宽瓶颈,让CPU和GPU能够以接近内存速度共享数据,实现模型加载、预处理和计算之间的零拷贝切换。
受益标的:(1)整机组装:工业富联;(2)连接器:立讯精密、汇聚科技、瑞可达等;(3)PCB:胜宏科技、沪电股份、生益科技、景旺电子等;(4)散热:英维克、领益智造、蓝思科技、思泉新材、中石科技;(5)电源:欧陆通、奥海科技。
风险提示:AI产业发展不及预期、国际贸易不确定性风险、宏观经济发展不及预期。
