首页 - 股票 - 研报 - 行业研究 - 正文

人工智能专题报告(1):适合投资人的DeepSeek分析报告

来源:爱建证券 作者:许亮 2025-02-19 11:17:00
关注证券之星官方微博:
(以下内容从爱建证券《人工智能专题报告(1):适合投资人的DeepSeek分析报告》研报附件原文摘录)
本期投资提示:
2025年1月20日,DeepSeek发布自研模型R1在全球科技行业引起的震动,被西方媒体称为“DeepSeekShock”。DeepSeek不仅在媒体圈迅速爆火,同样也成为了资本市场的宠儿,其概念指数仅仅诞生10日后板块成交金额就超过了全部A股成交额的20%。这一切现象究其原因,是因为DeepSeek通过技术微创新,以更低的硬件成本和更短的时间实现了可以与市场领先产品竞争的能力。更重要的是,DeepSeek打破了行业“限制中国企业对于最先进GPU获取,将能够阻止中国AI技术发展”的一贯认知。
本文有别于市场上大部分研究报告冗长的技术细节描述,我们针对投资人短时间内客观理解DeepSeek的需求,加入了不同于市场的思考和量化的分析比较。以下是报告的核心观点:
DeepSeek的技术创新在哪里?1)首创DeepSeekMoE架构,专门设计用于实现终极专家专业化。DeepSeekMoE通过降低激活参数比例,实现了训练效率3.6X的提升和训练吞吐量3.6X的提升。2)通过引入MLA机制,DeepSeek-V2实现了显著增强的性能,节省了42.5%的训练成本、减少了93.3%的KV缓存、并将最大生成吞吐量提升至5.76倍。
DeepSeek-V3实际开发成本几何?公司官宣正式训练成本为580万美元,但是并没有披露隐性成本。DeepSeek-V3是建立在前期模型基础上开发的,前期研发投入约为2000-3000万美元。其他数据获取成本和硬件折旧成本未披露,实验试错成本约为500万美元,因此预计实际总成本超过4000万美元。实际成本虽然高达公开口径成本的7倍左右,但是仍然相对Llama3-405B降低了约69%;相对于GPT-4o降低了95%。
未来GPU算力需求会大幅下降吗?短期内云服务大厂资本开支持续处于上升通道,这是由于ScalingLaw导致行业对于算力军备竞赛的恐慌性投资仍然存在。但是ScalingLaw中,数据资源同样限制着模型性能的提升。根据EPOCHAI预测,到2028年人类生成的公共文本数据总有效库存量约为300Ttoken将被全部耗尽。换句话说,在现有模型框架和数据资源供给下,2028年之后单纯算力提升将难以继续推动模型性能的升级。
核心结论:
给予行业“强于大市”评级。随着DeepSeek的横空出世,低成本高性能的模型训练部署成为可能。我们预计接入DeepSeekAPI的细分领域推理服务商将会快速涌现,同时终端设备将会能够实现蒸馏小模型的本地部署能力,包括服务器,智能手机和智能驾驶系统都将会迎来新一轮的升级浪潮。我们看好以下细分板块在DeepSeek推动下的未来发展:
先进算力芯片制造产业链:算力芯片设计,先进制程晶圆代工,先进封测等等。
专业咨询服务:包括AI+医疗,法律,金融,会计,教育,政务等咨询服务领域。
2C智能终端:AI+智能手机,智驾汽车等终端产业链。
2B本地部署设备:服务器OEM及产业链。
风险提示:大模型开发进度缓慢,模型升级不及预期。AI行业应用落地迟缓,商业模式难以实现良性循环。贸易摩擦加剧,先进芯片及半导体技术受限。





微信
扫描二维码
关注
证券之星微信
APP下载
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-