(以下内容从华安证券《AI算力行业深度:昇腾万里,力算未来》研报附件原文摘录)
主要观点:
昇腾910训练AI处理器,比肩英伟达先进产品
昇腾910,高性能训练AI处理器,性能接近英伟达A100(40GB),半精度(FP16)算力达到320TFLOPS,整数精度(INT8)算力达到640TOPS,功耗310W,采用7nm先进工艺。此外,昇腾910集成了HCCS、PCIe4.0和RoCEv2接口,为构建横向扩展(ScaleOut)和纵向扩展(ScaleUp)系统提供了灵活高效的方法,互联能力突出。
昇腾310,高能效比推理型AI处理器,本质上是一块完整的SoC,集成了多个运算单元,包括CPU(8个a55)、AICore、数字视觉预处理子系统等,实现高通量、大算力和低功耗的推理能力。
芯片、板卡、服务器单元、AI集群,完整产品矩阵已经落地
基于昇腾芯片族,华为开发了一系列加速卡产品,包括单卡280TFLOPSFP16算力的Atlas300T训练卡、Atlas300IPro推理卡,以及双核心Atlas300IDuo推理卡等一些列产品。服务器方面,华为鲲鹏和英特尔CPU均可选配,Atlas800训练服务器(型号9000)是基于华为鲲鹏920+昇腾910处理器的AI训练服务器,实现高度自主可控,广泛应用于深度学习模型开发和AI训练服务场景,并存在水冷散热机型可选。集群方面,Atlas900PoD集群基础单元搭载超32颗鲲鹏920处理器,47U高度可最大提供20.4PFLOPSFP16AI算力,采用液冷散热,最大功耗为46kw。
CUDA生态并非唯一选择,智算中心建设正在快速推进
异构计算架构(CANN)是对标英伟达的CUDA+CuDNN的核心软件层。基于昇腾生态,目前已经收录「紫东.太初」、「武汉.Luojia」、「鹏程.盘古」、「鹏程.神农」、「空天·灵眸」等大模型,分别适用于多模态、遥感、中文自然语言、医学、空天信息化等领域。
算力中心建设方面,算力网络初步形成。以中原人工智能计算中心为例,基于“黄河鲲鹏+昇腾技术”底座。项目总投资10亿元,于2021年10月21日正式上线。一期建设规模为100PAI算力,未来将达到300PAI算力。截止到2022年底,该中心服务中原企业客户60余家,高校学院客户30余家,科研单位10余家,同时还有省外活跃客户百余家,平均算力使用率在90%左右。
投资建议
随着全国智算中心的投入建设和AI生态的日趋完善,大量的应用场景将持续落地,围绕华为昇腾生态的软硬件企业或将受益,建议关注:神州数码、同方股份、科大讯飞、润和软件。
风险提示
1)技术研发不及预期;
2)政策支持不及预期;
3)下游需求不及预期。