(以下内容从华龙证券《AI产业系列跟踪专题研究报告:DeepSeek重塑AI产业格局,助力AI端侧落地》研报附件原文摘录)
DeepSeek-V3和R1模型凭借卓越的性能和创新的技术,迅速在全球AI领域崭露头角。2024年12月26日,公司发布全新系列模型DeepSeek-V3并同步开源,DeepSeek-V3为自研MoE模型,多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。2025年1月20日,DeepSeek发布了推理模型DeepSeek-R1,该模型在后训练阶段大规模使用了强化学习技术,在仅仅使用极少标注数据的情况下,极大提升了模型推理能力,在数据、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
DeepSeek-V3技术创新:架构优化与训练效率提升。DeepSeek-V3在继承DeepSeek-V2高效架构的基础上,通过创新的负载均衡策略和多标记预测(MTP)目标,进一步优化了模型性能。该模型率先采用无需辅助损失的负载均衡策略,有效降低了因负载均衡导致的性能下降。同时,MTP目标不仅提升了模型性能,还支持推理加速中的推测性解码。在预训练阶段,DeepSeek-V3通过FP8混合精度训练框架和算法、框架、硬件的协同设计,克服了跨节点MoE训练中的通信瓶颈,实现了计算与通信的高效重叠,显著提升了训练效率并降低了成本。最终,以仅266.4万H800GPU小时的经济成本完成了在14.8万亿标记上的预训练,成为目前最强的开源基础模型。在后训练阶段,DeepSeek-V3通过知识蒸馏技术,将长链推理(CoT)模型的推理能力融入其中,显著提升了推理性能,同时保持了输出风格和长度的可控性。
科技巨头纷纷接入DeepSeek,推动全球AI生态发展。2025年1月30日,英伟达宣布DeepSeek-R1模型作为NVIDIANIM微服务预览版上线,为企业提供了高效推理服务。紧接着,1月29日,微软将DeepSeek-R1纳入AzureAI Foundry平台,支持企业通过无服务器端点访问该模型。此外,DeepSeek-R1还上线了GitHubModels,开发者可免费试用。2月1日,硅基流动与华为云联合发布了基于昇腾云服务的DeepSeek R1/V3推理服务,凭借自研推理加速引擎,该服务在性能上与全球高端GPU部署模型相当,同时提供稳定、生产级的服务能力,满足大规模商用需求,并依托华为云昇腾云服务的强大算力支持。
投资建议:DeepSeek-V3/R1的推出代表中国在全球AI领域的技术引领,极大地提振了全球AI产业的信心,为AI产业的长期增长提供了强大动力。借助AI算法,公司可以精准分析用户偏好,实现个性化内容推荐,进而提高用户参与度和留存率,增强其市场竞争力。同时,AI能够根据企业的需求生成创意内容,如剧本创作、角色设计、故事背景等,为影视、动漫、游戏等领域提供丰富的创意灵感,推动行业内容的多元化发展。因此,维持传媒行业“推荐”评级。建议重点关注:三七互娱、姚记科技、昆仑万维、世纪天鸿、上海电影、博纳影业、光线传媒、万达电影、视觉中国、汤姆猫、实丰文化。
风险提示:市场需求增长不及预期、技术研发进展不及预期、竞争加剧导致盈利空间受限风险、外部环境风险、政策支持风险。
