首页 - 股票 - 研报 - 行业研究 - 正文

计算机行业跟踪:从Deepseek-V2定价看大模型降本新风向

来源:华福证券 作者:钱劲宇 2024-05-10 13:24:00
关注证券之星官方微博:
(以下内容从华福证券《计算机行业跟踪:从Deepseek-V2定价看大模型降本新风向》研报附件原文摘录)
投资要点:
幻方发布第二代MoE模型DeepSeek-V2,综合性能位列第一梯队。
2024年5月6日,幻方发布第二代MoE模型DeepSeek-V2。在AlignBench、MT-Bench、MMLU等多个benchmark上表现出色,其中AlignBench在开源模型中居首位,与GPT-4-Turbo,文心4.0比肩。MT-Bench超过最强MoE开源模型Mixtral8x22B。
DeepSeek-V2定价降至冰点,大模型价格战拉开序幕。
DeepSeek-V2(32k)每百万tokens输入/输出价格分别为1/2元,而GPT-4-Turbo-1106分别为72/217元,DeepSeek-V2性价比显著。相对于Claude3Haiku,DeepSeek-V2每百万tokens输入/输出价格也仅为其50%/22.2%。除此之外,同为32k上下文版本的moonshot-v1、SenseChat-32K、Qwen1.572B每百万tokens输入/输出价格分别为24/24、36/36、20/20元。此次DeepSeek-V2定价发布有望掀起新一轮大模型价格战,api定价有望持续走低。
大模型定价下降的背后离不开成本的优化。
目前,众多大模型已经通过多种方式降低成本。从模型压缩的方向看,可以通过量化的形式将浮点表征为低位宽模型来压缩模型存储空间,加速模型推理;从模型架构的方向看,MoE架构由于其内部的专家模型能够分配到不同设备,并可以执行并行计算,其计算效率较稠密模型显著提升,进而带来更低的成本。从tokens量的方向来看,可以通过prompt压缩等方式直接降低输入端tokens,进而降低成本。除此之外,多种新的方案已出现在相关论文中,未来多种成本优化方案的融合将进一步加速模型成本的下降。
我们认为,大模型成本优化与算力需求并不是直接的此长彼消,而是互相搭台、相互成就。定价的持续走低有望带来更快的商业化落地,进而会衍生出更多的微调及推理等需求,将逐步盘活国内AI应用及国产算力发展。
建议关注:
AI算力:寒武纪、海光信息、浪潮信息、中科曙光等。
AI应用:金山办公、科大讯飞、福昕软件、云从科技、商汤、出门问问等。
风险提示
大模型优化不及预期的风险;商业落地不及预期的风险等。





微信
扫描二维码
关注
证券之星微信
APP下载
好投资评级:
好价格评级:
证券之星估值分析提示浪潮信息盈利能力一般,未来营收成长性良好。综合基本面各维度看,股价合理。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-