(原标题:英伟达业绩大超预期,H200捧火新技术风口)
昨晚,英伟达披露24财年第三季度业绩。
得益于数据中心领域的强劲需求,NVIDIA 本季度各项业绩指标全面超出华尔街预期。总收入同比增长206%,达到创纪录的181.2亿美元,远超预期的160亿美元,凸显了该公司在更加依赖加速计算的AI芯片市场中的技术领先地位。
数据中心业务仍然是主要增长引擎,收入达145.1亿美元,较上年同期增长 279%。
随着云提供商和互联网公司利用该平台为大型语言模型、推荐引擎和生成应用程序等人工智能工作负载提供支持,对由新的Hopper GPU架构提供支持的NVIDIA HGX平台的巨大需求推动业绩放量。
然而,市场对英伟达在中国市场的销售表现下滑已经开始有预期,导致公司股价盘后交易中下跌1%。
公司CFO表示,由于最近的许可限制,对中国的销售额预计将下降,但其他高增长地区的强劲贡献预计将抵消这一影响。受限制地区的产品销售大概占了公司数据中心收入的20%-25%。
10月17日美国商务部发布一系列新的芯片出口限制,扩大对高级人工智能芯片的定义以避免转手给中国,只要芯片总算力大于或等于4800TOPS,或性能密度达到一定阈值,都将受到管制。
据CFO透露,英伟达正在为中国开发新的合规芯片。本月早些时候有媒体报道称,英伟达已开发出针对中国最新的算力系列芯片—HGXH20、L20PCle和L2PCle,都是由H100该款而来,能够符合美国相关规定。
随着渠道库存水平正常化,游戏收入同比增长81%至25.6亿美元。
广受好评的 GeForce RTX 40系列的推出预示着假期季节将继续保持强劲势头。由于笔记本电脑采用率的提高以及利用 RTX 和 Omniverse 技术的设计工作流程的加强,专业可视化增长了108%。
新的出口管制对高端消费级显卡同样有约束力,导致英伟达旗舰游戏显卡一夜间全网断货。据英伟达中国官网显示,RTX 4090信息已经移除,在国内电商渠道已经下架,包括华硕、七彩虹等合作商。
NVIDIA预计会在明年初的CES 2024上宣布RTX 40 SUPER系列升级版显卡,包括RTX 4080 SUPER、RTX 4070 Ti SUPER、RTX 4070 SUPER,为此已经提前停止了RTX 4080、RTX 4070 Ti的大规模量产。
专业可视化和自动驾驶业绩贡献占比较小,分别取得4.16亿美元,+108%/2.61亿美元,+4%。
GAAP(74%)和非GAAP(75%)毛利率均因中数据中心业绩贡献和较低的费用而大幅增长,运营支出增长较为温和。
展望未来,管理层预计四季度收入将达到200亿美元,比上一季度增长34%。Hopper等新架构的持续创新和执行使NVIDIA能够充分利用跨多个行业不断展开的人工智能革命。
强劲的业绩和前景表明NVIDIA仍然是加速计算领域明显的技术领导者。由于人工智能的采用仍处于早期阶段,公司处于保持高于市场水平的扩张的有利位置。
发布财报前一周,英伟达还推出了H200 GPU。
作为H100 GPU的继任者,也是该公司首款使用 HBM3e 内存的芯片,拥有高达141GB的显存。借助HBM3e,与A100相比,H200的容量几乎翻了一番,带宽也增加了2.4倍。
与H100相比,H200的带宽则从3.35TB/s增加到了4.8TB/s,带来了进一步的性能飞跃,用跑模型来反映其进步,让Llama2 70B在两款芯片上运作,H200的推理速度比前任提升了一倍。
GPU搭载的内存芯片带宽关联GPU数据处理能力,高带宽的内存芯片可以为GPU提供更快的并行数据处理速度,H200带宽和内存容量的扩大,得益于存储单元HBM技术的使用。
AI大模型训练的内存分为静态内存和动态内存,动态变化的部分是内存占用的主要原因。当处理器算力增长速度超过提取内存的能力范围,“内存墙”的存在就会造成综合算力的瓶颈。
据行业预计,处理器的峰值算力每两年增长3.1倍,而动态存储器(DRAM)的带宽每两年增长1.4倍,相差1.7倍。
为了解决这个问题,把DRAM从传统2D转变为立体3D结构的HBM成为了GPU存储单元的理想解决方案。
HBM是3D DRAM的一种形式,相较于其他DRAM的集成方式,HBM存储单元外的导线长度最短,数据传递速度最快,损耗最小,是目前最理想化的3D DRAM形式。
在HBM产品供应上,拥有一半份额的SK海力士在2013年首次推出HBM存储器,包含3个DRAM单元,后续陆续推出HBM2、HBM2e和HBM3,带宽和 I/O 速度进一步提升,当前海力士已经实现了HBM3的量产并搭载于H100中,计划24年开始量产下一代HBM3e,
与SK 海力士建立了合作关系的国内企业或间接受益,雅克科技是其前驱体的核心供应商;香农芯创是海力士HBM的分销商,太极实业为海力士DRAM产品提供后续服务。
而三星也预计将在今年4季度开始向北美客户供应HBM3;美光在此前的财报会议上表示将在2024年通过HBM3E实现追赶,预计其HBM3E将于2024年Q3或者Q4开始为英伟达的下一代GPU供应。
当前高端GPU均已搭载HBM作为存储单元的标配。NVIDIA高端GPUH100、A100主采HBM2e、HBM3,H100 GPU上主要搭载HBM3 内存。此外,AMD的MI200、MI300 以及 Google 自研TPU 等均将搭载高带宽的HBM 提升内存能力。随着多家科技公司陆续推出自研AI芯片,HBM客户群将大幅扩容,需求增长倒逼产能供给侧加速输出。
据报道称,全球最大的两家存储器芯片制造商三星和SK海力士正准备将HBM产量提高2.5倍,全球第三大DRAM公司美光也将从2024年开始积极瞄准HBM市场。
据TrendForce,2022年SK海力士、三星、美光HBM市占率分别为50%、40%、10%,2023年预计分别53%、38%、9%。2024年HBM整体营收有望超过89亿美元,复合增速127%。
存储芯片技术路径的进化对工艺、材料、设备端都意味着升级换代和需求增长的机会。
HBM工艺把DRAM技术路径从平面带向了3D结构,通过核心技术TSV(硅通孔技术)垂直堆叠多个DRAM,充分利用空间增加内存芯片密度。相比平面,TSV可以减小互连长度和信号延迟,从而实现芯片间的低功耗、高通信。中微公司是目前国内TSV设备的主要供应商。
其次,HBM先进 DRAM 加工工艺和TSV加工工艺两个环节中,ALD(原子层沉积)设备必不可少。
原子层沉积(ALD)是将原子逐层沉积在衬底材料上的工艺,通过将两种或多种前驱体交替通过衬底表面,发生化学吸附反应逐层沉积在衬底表面,能对复杂形貌基底表面全覆盖成膜,设备的精度是核心要求。拓荆科技是国内ALD 设备的主要供应商之一。
更新需求比较大的还有IC载板。在目前应用较广的 2.5D+3D 的先进封装集成电路中,都采用 IC 载板作为承载芯片的转接板,为芯片提供电连接、保护、制成、散热等功效,相较于普通 PCB,IC 载板具有高密度、高脚数、高性能、小型化及轻薄化特点。
IC 载板已经成为封装工艺价值量最大的材料,在传统封装中约占40%-50%,在先进封装中约占70%-80%。国内布局IC载板的企业包括兴森科技、深南电路、华正新材、满坤科技等。
据Yole 数据,预计全球先进封装将从2019年的290亿美元,增长到2025年的420亿美元,占封装市场整体份额的49.4%。根据Prismark 数据,2025年IC载板预计将达到162亿美元的产值,2021-2026年年均复合增长率为9.7%,增速领跑PCB行业整体。