首页 - 股票 - 研报 - 行业研究 - 正文

传媒行业动态跟踪:英伟达:Groq赋能推理算力

来源:华福证券 作者:杨晓峰,于怡然 2025-12-30 17:42:00
关注证券之星官方微博:
(以下内容从华福证券《传媒行业动态跟踪:英伟达:Groq赋能推理算力》研报附件原文摘录)
投资要点:
一、事件背景:英伟达与AI推理芯片公司Groq战略合作
12月24日,AI芯片初创公司Groq宣布与英伟达就推理技术达成非独家许可协议。根据协议,Groq创始人JonathanRoss、总裁SunnyMadra及核心团队将加入英伟达,共同推进授权技术的升级与规模化应用。Groq将继续作为独立公司运营,SimonEdwards接任CEO职务,GroqCloud云服务保持正常运行。
Groq商业化在2024年突破,已与Meta、主权AI达成合作。Groq创立于2016年,2024年8月、2025年2月和9月,Groq分别完成三轮融资,引入思科、三星、德国电信等产投。截至2024年9月,Groq已吸引超过200万开发者用户,并拿下多个重量级客户:与Meta合作运行Llama大模型,与沙特阿美达成15亿美元协议建设全球最大AI推理数据中心,成为加拿大贝尔主权AI网络的独家推理提供商。
二、行业趋势:推理市场整体高速扩张
推理算力需求高速增长。当前全球AI产业正从模型训练阶段迈入规模化推理落地的关键期,低延迟、高能效的推理算力成为核心刚需。
国内外推理Tokens增长共振。海外侧,截至今年7月,谷歌月度处理Tokens达980万亿,相较5月翻倍;国内侧,截至今年12月豆包大模型日均调用量已经突破50万亿Tokens,较去年同期增长超过10倍。
三、Groq技术价值:LPU+SRAM架构优化推理效果
GroqLPU设计纲领为“为速度和精确度而生”。LPU采用编译期静态调度与确定性执行架构,从而在运行大型语言模型等推理任务时实现逐token的可预测、低延迟执行。据官网,LPU运行大型语言模型及其他主流模型的速度显著更快。
Groq选择以片上SRAM作为核心存储。片上SRAM作为主要权重存储,显著降低了访问延迟,允许计算单元以全速拉入权重,通过将单层拆分到多个芯片实现张量并行。这种架构成为部署快速且可扩展推理的优势。
Groq第二代LPU采用三星4nm工艺节点。Groq第一代LPU芯片采用GlobalFoundries14nm制程工艺节点,Groq第二代LPU采用三
星(SF4X)制程工艺节点,在三星德州泰勒工厂制造。Groq两代芯片均未绑定台积电先进制程需求。
四、投资建议
看好国内外推理算力需求增长和相关产业链。国内端,建议关注晶圆厂和上游设备扩产需求。海外端,建议关注推理算力需求增长下带动的光模块、机柜组装代工需求增长。
风险提示:
大模型竞争激烈,大模型推理竞争激烈





微信
扫描二维码
关注
证券之星微信
APP下载
广告
相关股票:
好投资评级:
好价格评级:
证券之星估值分析提示长和行业内竞争力的护城河较差,盈利能力良好,营收成长性较差,综合基本面各维度看,股价偏高。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-