首页 - 股票 - 研报 - 行业研究 - 正文

电子行业事项点评:DeepSeek发布NSA,马斯克旗下XAI发布GroK 3

来源:信达证券 作者:莫文宇,杨宇轩 2025-02-21 12:41:00
关注证券之星官方微博:
(以下内容从信达证券《电子行业事项点评:DeepSeek发布NSA,马斯克旗下XAI发布GroK 3》研报附件原文摘录)
本期内容提要:
DeepSeek发布NSA,创新性降低成本的同时保障了模型性能。人工智能发展高度依赖海量数据和算力,DeepSeek提出神经缩放增强(Neural Scaling Augmentation,NSA)技术,可通数据生成和模型优化的方法,为突破模型瓶颈提供全新的解决方案。NSA引入了两个核心创新点:(1)硬件对齐系统:优化块级稀疏注意力,使其充分利用Tensor Core并优化内存访问,从而实现平衡的算术强度。(2)训练感知设计:通过高效算法和反向传播运算符实现稳定的端到端训练,使NSA能够同时支持高效推理与完整训练流程。在性能方面,尽管NSA具有稀疏性,但在一般基准测试上NSA与全注意力基线表现相当。在长文本评估中,NSA在64k上下文中的「大海捞针」测试中,在所有位置上都实现了完美的检索准确率,这表明其长文本处理方面具有良好的优势。在速度方面,随着上下文长度的增加,NSA实现了越来越大的加速,在64k上下文长度下实现了9.0倍的前向加速和6.0倍的反向加速。相比之下,随着解码长度的增加,NSA在延迟方面表现出显著的减少,在64k上下文长度下实现了高达11.6倍的加速。
马斯克旗下XAI发布GroK3,性能有所提升。GroK3/GroK3-mini在数学、科学、代码等性能上超过GPT-4o、Claude3.5Sonnet、DeepSeek-R1和Gemini-2Pro等主流模型。此外,Grok3具备代理/智能体(Agent)功能,它不仅可以搜索网页,查找现有资料,还可以加以思考,从而返回正确的信息。据悉,Grok3在10万个GPU上进行训练,总训练时长达到2亿GPU小时,Grok3的计算资源是Grok2的10倍。
算力投入叠加算法创新,2025年或为AI商业化大年。我们认为,从目前看,中国团队的创新工作降低了模型训练和推理的成本,有望较大程度将AI商业化推向繁荣。目前全球越来越多的厂商加入了AI的竞争之中,模型迭代速度不断加快。从训练端看,除了对模型的性能要求更高之外,研发迭代的周期也要不断缩短,否则相关的研究可能变得一文不值。这可能在某种程度上加大训练算力的需求。从推理端市场看,从DeepSeek的广泛铺开可以看到推理算力需求正以肉眼可见的速度成长,而目前推理成本的迅速降低,将有望推动复杂场景落地,AGI之路更近一步。总体上2025年算力需求仍然有很大空间,叠加是英伟达GB系列产品放量之年,模型端的迅速进展有望推动端侧创新,算力硬件和各类应用有望共同繁荣,相关产业链值得重点关注。
建议关注:【ODM】工业富联;【PCB】深南电路/生益科技/沪电股份/胜宏科技/生益电子/广合科技/景旺电子等;
风险因素:宏观经济下行风险;下游需求不及预期风险;中美贸易摩擦加剧风险。





fund

微信
扫描二维码
关注
证券之星微信
APP下载
好投资评级:
好价格评级:
证券之星估值分析提示广合科技盈利能力优秀,未来营收成长性一般。综合基本面各维度看,股价合理。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-