(以下内容从华福证券《电子行业算力周跟踪:英伟达Blackwell推迟持续发酵,持续重视国产算力需求释放》研报附件原文摘录)
投资要点:
本周海外算力板块受情绪影响较大。本周(0805-0807)英伟达-7.79%,主要由于Blackwell芯片因设计缺陷推迟上市。国内算力板块出现较大回调,海光信息-8.12%,龙芯中科-6.24%,寒武纪-6.36%,主要受市场对于英伟达芯片推迟的担忧情绪影响。我们认为,市场需求仍然存在,市场担忧情绪释放,算力链有望迎来新的增长机会。本周英特尔-11.03%,已经连续四周下跌,或因业绩未达市场预期,叠加大幅裁员影响。
一、英伟达Blackwell架构GPU设计缺陷引发链式效应
英伟达下一代基于Blackwell架构的AIGPU因设计缺陷问题推迟上市。8月3日,据TheInformation报道,Blackwell系列中最先进的AI芯片B200的上市时间可能推迟三个月或更长。台积电工程师为量产进行准备时,在连接两个BlackwellGPU的裸晶上发现了设计缺陷,这一缺陷会导
致芯片良率或产量降低,通常做法是停止量产。台积电原计划在今年Q3
大量生产Blackwell,并于Q4向英伟达大量交付。目前,B200芯片可能推迟至24Q4量产,出货可能推延至25Q1或更晚,商用上线可能要等到25Q2。据KeybancCapitalMarkets估算,Blackwell芯片为英伟达数据中心带来的收入将从2024年的475亿美元,提升到2025年超2000亿美元。英伟达回应,Blackwell样品已经开始送出,生产正按计划在2024年下半年增加到大规模生产,并补充说,市场对其现有的Hopper芯片的需求仍然非常强劲。
Blackwell芯片延迟上市可能会影响Meta、谷歌和微软等的AI训练进程和数据中心建设。谷歌已经订购超40万个GB200,外加服务器硬件,订单成本远超100亿美元。今年谷歌已经在芯片和其他设备财产上,支出预计约为500亿美元,比去年增长了超过50%。另外,Meta提交了至少100亿美元的订单,而微软订单规模近几周增加了20%。知情人士透露,微软计划到2025年第一季度,为OpenAI准备5.5万-6.5万个GB200芯片。而且,微软管理层原计划在25年1月,向OpenAI提供Blackwell驱动的服务器。
二、关注大模型运行算力需求,持续重视国产算力需求释放
中国移动7994台AI服务器集采结果落地,关注运营商侧国产替代进程。8月6日,中国移动发布了2024年至2025年新型智算中心采购中标结果。本次共集采7994台AI服务器,共计191亿元,中标份额为昆仑技术21.05%,华鲲振宇17.54%,宝德15.79%,百信14.04%,长江12.28%,神州鲲泰10.53%,湘江鲲鹏8.77%。若以单台服务器8卡计算,我们预计大约可对应6.4万张算力卡。此前,移动23-24年招标采购AI服务器计划已达到2454台,与本次招标量合计已超过万台。
关注CPU通用服务器在模型推理侧的更多机会。浪潮信息在2U四路的NF8260G7服务器上成功运行了千亿参数的源2.0大模型。运行过程中,服务器仅使用了4颗英特尔6448H芯片,算力达到430TOPS(INT8)或215TFLOPS(BF16),无需GPU或其他任何额外的AI加速卡。通用服务
器相比于AI加速芯片来说拥有更低的部署和推理成本,内存容量远大于GPU芯片的显存容量,同时通用服务器之间通信效率更高。这项技术突破降低了AI部署成本,并允许传统行业利用现有硬件运行AI模型。
轻量级开源模型降低计算要求,或对移动AI和边缘计算产生重大影响。8月1日,谷歌开源端侧小模型Gemma22B版本,可以在GoogleColab的T4GPU免费层上运行,在大模型竞技场LMSYSChatbotArena中仅凭
诚信专业发现价值1
20亿参数就跑赢了GPT-3.5-Turbo。8月6日,智谱AI宣布将与清影同源的视频生成模型——CogVideoX开源。CogVideoX-2B的提示词上限为226token,视频长度为6s,帧率为8帧/s,视频分辨率为720*480。CogVideoX-2B在FP-16精度下的推理仅需18GB显存,微调只需要40GB显存,这意味着单张4090显卡即可进行推理,而单张A6000显卡即可完成微调。
三、AI大模型跟踪
可灵访问量值得期待,讯飞星火App下载量持续攀升。据similarweb最新数据(0726-0801):(1)OpenAI本周访问量有所上升。上周OpenAI发布SearchGPT并推出GPT-4o高级语音模式,本周访问量相应回升。(2)腾讯混元近三周表现不佳,与其他国产文本模型差距扩大。8月7日,腾讯混元元宝上线长文精读能力,期待后续访问量表现。(3)Runway访问量本周有所上升。7月31日,Runway推出了Gen-3Alpha的Turbo版本,比原来Gen-3Alpha生成视频的速度快7倍。(4)可灵访问量七月以来超300万。7月25日,可灵全面开放注册,网页版集成了文生图、文生视频以及不久后将支持的视频编辑能力,成为发布即可用的一站式视觉内容创作平台。可灵AI的三大亮点功能,包括高画质版、首尾帧控制和相机镜头控制。据七麦数据(0801-0806),讯飞星火APP热度不减,本周下载量超360万。8月6日,通义App推出角色扮演功能,可以广泛应用于影视动画制作、创意短视频以及电商直播等场景。
建议关注
国产算力链:寒武纪、海光信息、龙芯中科、盛科通信等。
数据中心硬件:中际旭创、工业富联、新易盛、天孚通信、沃尔核材、英维克、沪电股份、胜宏科技。
风险提示
技术发展及落地不及预期;下游终端出货不及预期;下游需求不及预期;市场竞争加剧风险;地缘政治风险。