国泰君安:DEEPSEEK开源低成本模型引发行业巨震

来源:智通财经 2025-02-03 16:38:29
关注证券之星官方微博:

(原标题:国泰君安:DEEPSEEK开源低成本模型引发行业巨震)

智通财经APP获悉,国泰君安发布研报称,DeepSeek R1具备优异性价比,其蒸馏所得小模型推理性能优越,将加速端侧AI落地。目前硅基流动推出基于昇腾云的DeepSeek R1&V3 推理服务,有望引领国产AI算力、AI芯片技术生态、AI大模型闭环,国产算力产业链及端侧硬件有望受益。

国泰君安主要观点如下:

DeepSeek R1 API定价最低仅为1元/百万tokens,性能对标O1模型,霸榜苹果应用商店140+国家/地区免费应用第一名

根据Deepseek官网,Deepseek R1 API服务定价为0.14 美元/百万输入tokens(缓存命中),2.19美元/百万输出tokens。其在逻辑、数学及中文任务中表现出色,性能优于GPT-4o、O1-mini等模型。优异性价比驱动用户数量快速增长,上线18天日活即破1500万,增速达Chatgpt 13倍,并且霸榜苹果应用商店140+国家/地区免费应用第一名。未来用户数量有望加速提高,带动DeepSeek 服务器算力需求增长。

多token并行与FP8 训练提升V3训练效率,强化学习提高R1推理性能,R1蒸馏驱动端侧小模型落地

DeepSeek V3:(1)首创无辅助损失负载均衡策略,避免专家负载失衡。(2)通过采用多token并行预测与FP8混合精度训练,提高训练信号密度,提升模型推理能力,同时降低训练所需算力。(3)在训练框架中采用DualPipe算法,减少流水线空泡,通过计算-通信重叠隐藏大部分通信延迟。
DeepSeek R1:通过引入冷启动数据微调DeepSeek-V3-Base模型以及多阶段训练优化,其推理任务水平达到OpenAI-o1-1217。并且基于其高质量训练样本蒸馏所得的DeepSeek-R1-Distill-Qwen-7B,推理性能超越QwQ-32B-Preview。DeepSeek R1蒸馏所得的高推理性能小模型将加速端侧AI落地,驱动AI手机、AI PC、AI眼镜等硬件出货量上行。

海外巨头纷纷接入,昇腾云携手引领国产AI闭环

基于出色的推理性能及低廉的使用成本,目前微软、英伟达、亚马逊等海外巨头已接入DeepSeek R1 API。硅基流动已推出基于昇腾云服务的DeepSeek模型,其采用华为自研推理加速引擎,性能持平全球高端GPU部署模型效果。昇腾云与DeepSeek合作有望推动国产AI芯片、AI芯片技术生态与AI大模型闭环,加速国产AI算力生态自主可控。

投资建议

推荐中芯国际(00981,688981.SH)、华丰科技(688629.SH),中兴通讯(00763,000063.SZ)、联想集团(00992)、申菱环境(301018.SZ)、泰嘉股份(002843.SZ)等预计受益。

风险提示:端侧模型落地进展不及预期;AI技术迭代不及预期。

fund

微信
扫描二维码
关注
证券之星微信
APP下载
好投资评级:
好价格评级:
证券之星估值分析提示中兴通讯盈利能力一般,未来营收成长性优秀。综合基本面各维度看,股价合理。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-