(以下内容从信达证券《电子行业专题研究(普通):Deepseek R1是AGI的里程碑,中长期利好算力硬件》研报附件原文摘录)
本期内容提要:
DeepSeek树立里程碑,挖掘算法创新的价值潜力。Deepseek V3仍是基于Transformer架构的模型,是一个强大的专家混合(MoE)语言模型,总共有671B个参数,每个令牌激活了37B参数。DeepSeek-V3主要贡献包括:架构层面创新的负载均衡策略和训练目标,预训练层面大幅提高训练效率,后训练层面DeepSeek-R1的知识提炼等。DeepSeek团队仅以2.664M H800GPU小时的经济成本,在14.8Ttokens上完成了DeepSeek V3的预训练。Deepseek R1是基于Deepseek V3的架构上的集大成之作,性能对标OpenAI-o1。DeepSeek-R1-Zero是一种通过大规模强化学习(RL)训练的模型,没有监督微调(SFT)作为初步步骤,展示了卓越的推理能力。通过强化学习,DeepSeek-R1-Zero自然而然地出现了许多强大而有趣的推理行为。其中,DeepSeek-R1-Zero展示了自我验证、反射和生成长CoT等功能,这标志着研究界的重要里程碑。值得注意的是,这是第一个验证的开放研究,可以纯粹通过RL来激励的LLMs推理能力,而无需SFT。这一突破有望为该领域的未来发展铺平道路。此外,DeepSeek团队开源了DeepSeek-R1-Zero、DeepSeek-R1以及基于Qwen和Llama从DeepSeek-R1中提炼出来的六个密集模型(1.5B、7B、8B、14B、32B、70B),在部分测试上性能超越OpenAIo1-mini。
OpenAI掀起反攻号角,o3-mini和Deep Research相继发布。为了应对DeepSeek的挑战,OpenAI发布了O3-mini,理解物理世界能力、编程能力大幅提升。o3-mini在物理模拟高难度挑战中展现出惊人的实力,在模拟小球的转动时,o3-mini具备更强的物理推理能力,而DeepSeek R1则出现了反重力现象。此外,o3-mini能生成四维空间内小球的弹射程序,展现出很高的潜力。此外,OpanAI还发布了DeepResearch,这是OpenAI新发布代理——仅需一个提示,ChatGPT将查找、分析和综合数百个在线资源,以创建研究分析师级别的综合报告。它由即将推出的OpenAI o3模型版本提供支持,该版本针对Web浏览和数据分析进行了优化,它利用推理来搜索、解释和分析互联网上的大量文本、图像和PDF,并根据遇到的信息根据需要进行调整。
AI未来尚有星辰大海有待探索,AGI商业化奇点临近。谷歌DeepMind团队曾将AI划分为6大发展阶段,从狭义的层面看,在专业领域已经有AI模型能达到超人级别。如AlphaFold、AlphaZero、StockFish等AI模型可以在特定的领域完全超越人类,但是从通用人工智能的层面看,AI的发展还处于较低水平,如ChatGPT仅可以划分为Level1-Emerging级别。FIGURE是人形机器人领域的领导者之一,在其视角中,我们也能窥探AI的历史机遇。在如今全球GDP中,50%的劳动力均为人类劳动,大约42T美金空间,仅此一项,AI就有广阔的前景。
投资建议:算法创新和算力投入相辅相成,建议关注AI产业链标的。AI领域的发展速度超过传统制造业,2023年来,Scaling Laws开始发力,全球领域内开启了算力资源的“军备竞赛”。而在地缘政治等因素的激励下,算法层面的追赶终于由算力相对匮乏的的中国团队唱响号角。我们认为,在通向AGI的道路上,算法创新和算力资源都是不可或缺的。早在2024年,我们就明确了推理市场要想实现繁荣必须降低推理成本的结论。如今,豆包、DeepSeek研究团队的相关工作成功地大幅度降低了推理成本,推进了AI的产业化。DeepSeek的成功,是开源模型相对闭源模型的一次飞跃。诚然,在十分有限的时间区间内,北美的科技大厂或把有限的精力放在算法层面,以充分挖掘自身算力资源的潜力。但是,这并不意味着对算力的投入将会停止。相反,AI的产业化有望在中长期加速算力的投入,避免了以往的AI热潮最终因无法落地而走向失败的困局。从推理市场看:推理有望快速放量,文生文、文生视频、图生视频的各类功能或快速迭代,并使得AI真正的理解物理世界,自动驾驶、人形机器人、AI在各行各业掀起产业革命的奇点临近。从训练市场看:一方面,训练模型的前沿探索仍需大量算力投入,且推理市场的放量,有望衍生新的模型探索方向。另一方面,如世界模型等方向的研究进展有望加速。但是,我们也看到大模型厂商的淘汰也将加速,无法超越开源模型的闭源大模型厂商或快速出清。扎克伯格曾在Meta法说会上表示,“随着时间的推移,就像每个企业都有一个网站、一个社交形象和一个电子邮件地址一样,在未来,每个企业也将拥有一个客户可以与之交互的AI代理。我们的目标是让每个小企业,最终每个企业,都可以轻松地将其所有内容和目录提取到一个AI代理中,从而推动销售并节省资金。”这一时点正在逐步临近,从历史看,当计算机从实验室走向千家万户,并没有导致相关的企业没落,而是孕育了许多伟大的企业。目前看,AI也有望经历这一过程,建议关注产业链相关标的。
相关个股:【AI云侧】工业富联/沪电股份/生益科技/深南电路/胜宏科技/寒武纪/海光信息;【AI端侧】蓝思科技/领益智造/鹏鼎控股/东山精密/乐鑫科技/瑞芯微/恒玄科技/全志科技/兆易创新/晶晨股份等。
风险因素:宏观经济下行风险;下游需求不及预期风险;中美贸易摩擦加剧风险。
![fund](//static.stockstar.com/etf/56050020250203.png)