财通证券:架构创新突破大模型推理延迟瓶颈 广阔市场空间有望快速放量

(原标题:财通证券:架构创新突破大模型推理延迟瓶颈 广阔市场空间有望快速放量)

智通财经APP获悉,财通证券发布研报称,LPU为新一代面向大模型推理阶段的芯片,核心为TSP架构。该行认为,LPU受益于低推理延时的优异表现,有望实现快速渗透,该行看好LPU的高成长性及LPU以机柜出货时带来的PCB机会,建议关注:智微智能(001339.SZ)(参股元川微)、星宸科技(301536.SZ)(多轮增资元川微)、沪电股份(002463.SZ)(英伟达PCB供应商)、胜宏科技(300476.SZ)(英伟达PCB供应商)、深南电路(002916.SZ)。

财通证券主要观点如下:

LPU为新一代面向大模型推理阶段的芯片,核心为TSP架构

LPU是专为顺序处理的计算密集型任务设计的新型芯片架构,核心在于TSP架构,包含五大功能模块,将经典的处理器五级流水线拆散在整个芯片内,进而消除了硬件的复杂性,使指令执行顺序和时间具有确定性。在TSP架构下,编译器可以直接访问并精确控制芯片的底层硬件状态,实现了软件定义硬件。

LPU可缩短大模型推理过程中的延迟,提高用户体验感

大模型在推理过程中会存在延迟,延迟与用户体验感精密挂钩,大模型推理过程中的延迟主要在Decode阶段,核心瓶颈在于内存带宽。LPU具备更快的内存带宽,可缩短大模型推理过程中的延迟。同时,基于LPU的大模型不仅具有更快的推理速度,还可以提供更具性价比的价格,可进一步提高用户体验感。

LPU具备广阔的潜在发展空间,已步入量产初期

目前Tokens的消耗量大幅增长,2024年初我国日均Token的消耗量为1000亿,2026年2月主流大模型合计日均Token消耗已到180万亿级别,Tokens消耗量快速增长,带动推理芯片市场规模的高增长。LPU可降低大模型推理的延迟,该行认为LPU有望在推理芯片市场中逐步渗透,具有高成长性的市场空间。目前LPU已步入量产初期,放量在即。

风险提示:AI技术迭代不及预期的风险;大模型发展不及预期的风险;LPU行业发展不及预期的风险。

fund

APP下载
广告
好投资评级:
好价格评级:
证券之星估值分析提示智微智能行业内竞争力的护城河良好,盈利能力良好,营收成长性优秀,综合基本面各维度看,估值偏高。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-