山西证券:头部模型推理性能进一步提升 重点关注AI应用相关标的

来源:智通财经 2025-02-21 10:37:34
关注证券之星官方微博:

(原标题:山西证券:头部模型推理性能进一步提升 重点关注AI应用相关标的)

智通财经APP获悉,山西证券发布研究报告称,Grok 3(Beta版)正式发布,得益于思维链推理能力的引入,Grok 3在解决复杂任务方面的表现较为突出。虽然Grok 3的发布预示着预训练阶段的Scaling Law仍在推动大模型的持续进步,但相较于DeepSeek,可以明显看出大模型在算法层面具备更大的进步空间。该行认为,其推理能力大幅提升将加速AI应用落地,重点关注AI应用相关标的。

事件:2月18日,Grok 3(Beta版)正式发布,并面向X的Premium Plus订阅用户率先开放,同时推出了每月30美元或每年300美元的Super Grok单独订阅服务,订阅用户可解锁深度搜索等先进功能,而语音交互功能将在约一周后上线。

山西证券主要观点如下:

Grok 3和Grok 3 mini在多方面性能上均超过或媲美Gemini、DeepSeek和ChatGPT等对手。

根据官方公布的测试数据,Grok 3和Grok 3 mini在数学推理(AIME)、科学逻辑推理(GPQA)和代码写作(LCB)的基准测试上性能表现优于DeepSeek V3、GPT-4o、Gemini 2 Pro及Claude 3.5 Sonnet,其中,Grok 3性能较DeepSeek V3提升了27%-43%。而在推理能力测试中,Grok 3和Grok 3 mini推理模型的性能再次刷新了sota,其中,相较于DeepSeek R1,Grok 3的性能表现提升了16%-22%。

得益于思维链推理能力的引入,Grok 3在解决复杂任务方面的表现较为突出。

Grok 3在发布会的演示上完成了多个复杂任务,包括正确编码并实现飞船从地球发射、登陆火星、到在下一个发射窗口返回地球的3D动画,其中Grok 3经过114秒的思考成功求解了开普勒定律,以及Grok 3融合俄罗斯方块和宝石迷阵的规则成功创作出新游戏。可以预计,未来Grok 3有望在医疗诊断、法律分析等复杂推理场景中得到深度应用。

Grok 3总训练成本预计高达DeepSeek V3模型的数倍乃至数百倍。

xAI公司为Grok 3配备了拥有20万个H100 GPU的Colossus超级计算机进行训练,Grok 3累计训练时长达2亿GPU小时,根据vast ai最新数据,H100租赁价格大约在1-3美元每GPU小时,因此估算Grok 3的训练成本预计可达数亿美元,而DeepSeek V3论文中披露的模型正式训练阶段的成本仅557.6万美元。虽然Grok 3的发布预示着预训练阶段的Scaling Law仍在推动大模型的持续进步,但相较于DeepSeek,可以明显看出大模型在算法层面具备更大的进步空间。

风险提示:AI产品落地不及预期,行业竞争加剧风险,技术研发进展不及预期。

微信
扫描二维码
关注
证券之星微信
APP下载
相关股票:
好投资评级:
好价格评级:
证券之星估值分析提示山西证券盈利能力较差,未来营收成长性良好。综合基本面各维度看,股价合理。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-