(以下内容从上海证券《计算机行业周报:DeepSeek开启大模型产业变革,AI应用加速推进》研报附件原文摘录)
市场回顾
过去一周(2.3-2.7)上证综指上涨1.63%,创业板指上涨5.36%,沪深300指数上涨1.98%,计算机(申万)指数上涨13.47%,跑赢上证综指11.84个百分点,跑赢创业板指8.11个百分点,跑赢沪深300指数11.49个百分点,位列全行业第1名。
周观点
DeepSeek持续火热,云服务及芯片大厂纷纷力挺。1月20日,DeepSeek发布全新的开源推理大模型DeepSeek-R1,在数学、编程和推理等多个任务上达到了与OpenAI o1相当的表现水平。2月8日,QuestMobile数据显示,DeepSeek在1月28日的日活跃用户数首次超越豆包,随后在2月1日突破3000万大关,成为史上最快达成这一里程碑的应用。DeepSeek的AI大模型持续火热,全球众多的科技大厂纷纷下场对DeepSeek模型进行支持。国内方面,据智东西,截至2月7日,已有包括华为昇腾在内的16家国产AI芯片企业相继宣布适配或上架DeepSeek模型服务,华为云在内的10家国内云计算巨头以及至少12家独立云及智算企业均宣布对DeepSeek的支持。海外方面,亚马逊AWS、微软等云服务大厂纷纷上线基于DeepSeek模型的云服务,英伟达、AMD、英特尔等芯片大厂纷纷完成对于DeepSeek模型的适配。
DeepSeek以模型开源推动AI平权,促进AI应用生态繁荣。DeepSeek凭借“低成本+高性能”模型全球破圈,通过“模型架构创新”和“软硬件协同工程优化”将大模型训练成本大幅度降低。DeepSeek早前发布的V3模型每训练1万亿tokens仅需在2048块H800GPU集群上耗时3.7天,总计278万GPU小时、557.6万美元的训练成本,约为GPT-o1的1/20、Llama3.1的1/10;新发布的R1模型API服务价格为每百万输入tokens1-4元、每百万输出tokens16元,远低于同期OpenAI o1API定价水平,且在逻辑、数学及中文任务中表现优异。通过最开放的MIT开源协议,和将推理大模型蒸馏给开源小模型等一系列工程方法,DeepSeek为业界带来低成本的端侧模型商品。我们认为,DeepSeek开源低成本的高性能模型,有望促进AI平权,加速AI应用的爆发,带动推理算力需求加速释放。
AI竞赛加剧,谷歌发布Gemini2.0。2月5日,谷歌发布AI模型套件Gemini2.0,包含适用于大规模且高频率任务的Gemini2.0Flash、具有最佳编程性能与处理复杂任务能力的Gemini2.0Pro Experimental以及极具性价比的Gemini2.0Flash-Lite,还有大幅提升推理能力的Gemini2.0Flash Thinking模型。在Chatbot Arena大模型排行榜上,Gemini2.0Flash Thinking实验版和Gemini2.0Pro实验版位居榜首,综合得分超过ChatGPT-4o和DeepSeek-R1。我们认为,以字节为代表的国产大模型崛起,有望拉动国内互联网大厂在算力端的支出,字节抢跑之后,腾讯、阿里、京东、快手或将开启追赶模式,国内算力竞赛刚刚开始,国产AI算力链将持续景气。
投资建议
建议关注:(1)AI算力:海光信息、寒武纪、中科曙光、神州数码、软通动力、华丰科技、泰嘉股份、申菱环境、英维克、润泽科技、安博通等;(2)AI应用:金山办公、科大讯飞、万兴科技、新致软件、梅安森、鼎捷数智、汉得信息、能科科技、佳发教育、竞业达、泛微网络、软通动力、中软国际、润和软件等。
风险提示
下游景气度不及预期;政策推进不及预期;技术创新不及预期、行业竞争加剧。