(以下内容从东吴证券《半导体行业点评报告:关注DeepSeek推动AI应用带来的推理需求,利好国产设备》研报附件原文摘录)
投资要点
训练卡侧重大模型,推理卡侧重实际应用:2022年OpenAI大模型推出前,全球推理和训练的AI芯片销售金额占比约各50%,二者最大的区别在于应用场景不同——训练卡造模型、推理卡用模型。训练卡以英伟达的H100、A100等型号为主,推理卡以A30、A10、T4、4090等型号为主。2023年开始大模型需求增长带动训练卡需求,英伟达收入的增长主要来自训练卡,收入占比达到70-80%,推理卡增速较为平稳,因为传统小模型推理应用没有大幅增长、大模型的实际应用还不完备。
伴随AI从模型研发转向规模化应用,算力重点逐步从训练转向推理:1月20日deepseek-R1模型发布并开源,以RL路径实现了大模型的底层范式创新,大幅降低了先进模型的训练+推理成本,模型层面的差距迅速缩小,为推理侧的实际应用爆发打下基础,未来的AI投入不再盲目“大力出奇迹”,逐渐将重心从预训练转向推理。
看好AI需求带动国产供应链,国产设备等有望受益:过去训练卡基本为英伟达独供,对应所需要的3D堆叠等先进工艺都由台积电进行代工;而推理卡不一定需要3-5nm的先进工艺,在国产12nm工艺平台上也有很强性价比,目前国内IC设计公司天数智芯、沐曦、燧原、登临等企业已经着手将推理卡移植在国产供应链,例如盛合晶微、中芯国际等,相关的国产供应链如先进封装等有望受益。根据我们的推算:(1)推理卡以华为昇腾310为例,一个约300平方毫米,一片12寸晶圆面积约7万平方毫米,则1片12寸的晶圆可产出约215个推理卡,再考虑70%的良率,实际产出约150个推理卡,按照目前静态来看,我国推理卡市场需求约200亿、单个推理卡2万块,则100万个推理卡需要6600+片12寸晶圆。(2)训练卡以华为昇腾910B为例,一个约1000平方毫米,一片12寸晶圆面积约7万平方毫米,则1片12寸的晶圆可产出约58个训练卡,再考虑30%的良率,实际产出约17个训练卡,按照目前静态来看,100亿资本投入对应约5000台GPU服务器、4万个训练卡,则4万个训练卡需要2300+片12寸晶圆。
投资建议:(1)先进封装:晶盛机电(减薄机)、迈为股份(切磨抛+键合机)、华海清科(减薄机)、盛美上海(电镀机)、芯源微(涂胶显影+键合机)、拓荆科技(键合机)、德龙激光(切片机)。(2)后道封测:华峰测控、长川科技。(3)前道制程:刻蚀+薄膜沉积设备北方华创、中微公司,量测设备中科飞测、精测电子,薄膜沉积设备拓荆科技、微导纳米等。
风险提示:下游扩产速度不及预期,设备国产化进程不及预期。