(以下内容从东兴证券《人工智能动态跟踪:计算机行业:DeepSeek提振国产大模型信心,有望促进AI行业发展》研报附件原文摘录)
事件:
(1)2024年12月底,DeepSeek-V3正式发布,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练;
(2)2025年1月底,DeepSeek-R1发布,性能对标OpenAI o1正式版。
点评:
算法+工程创新提升DeepSeek-V3模型效率,后训练阶段使用强化学习技术增强R1推理能力。(1)模型表现优异,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲;DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版;(2)推理效率提升,通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从20TPS提高至60TPS,相比V2.5模型实现了3倍的提升,使用体验更加流畅;(3)成本大幅降低,DeepSeek-V3和R1在web端和APP端可免费试用,调用API方面,DeepSeek-V3模型API服务定价调整为每百万输入tokens0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens8元;DeepSeek-R1API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元。
推理与多模态为大模型趋势,成本降低有利于大模型产品商业化落地进程。我们在《计算机行业2025年投资展望:信创、AI应用构投资主线,新质生产力领域具结构机会》(2024年12月31日)报告中指出,多模态、复杂推理能力提升仍为大模型迭代趋势,DeepSeek-R1低成本推出更是加速市场对大模型推理能力提升的认知及需求,有望促进大模型产品商业化落地进程。据AI产品榜统计,DeepSeek应用(APP)日活跃用户DAU第5天超过ChatGPT,第15天是ChatGPT的2倍,达259万日活跃用户,成为全球增速最快的AI原生应用。R1的推出及爆火验证了市场对大模型能力提升及成本下降的敏感度依然较高,从整个AI市场来看,成本下降带来的用户量提升的弹性较大,有望促进整个行业商业化落地进展提速。
投资建议:DeepSeek-V3及R1的推出提振国产大模型信心,验证大模型发展趋势,有望促进大模型商业化落地进程,(1)基础设施供应商如中科曙光、浪潮信息(通信组覆盖)等;(2)已发布通用大模型或积极探索AI行业应用落地的科大讯飞、昆仑万维、三六零、拓尔思等公司,以及(3)具备AI应用落地场景的相关标的,如金山办公、福昕软件等公司有望受益。
风险提示:大模型产品迭代不及预期、科技摩擦加剧影响行业发展、AI产品化商业化落地不及预期风险。
![fund](//static.stockstar.com/etf/20250205000004.png)