(以下内容从华安证券《全球科技(计算机)行业周报:DeepSeek V3.1发布有望催化国产算力需求及Agent应用》研报附件原文摘录)
主要观点:
DeepSeek V3.1正式发布,思考效率提提升、Agent能力显著增强8月21日,DeepSeek最新发布V3.1版本,本次升级包含1)混合推理架构:同时支持思考与非思考模式;2)思考效率提高:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;3)Agent能力增强:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。DeepSeek API也已同步升级,Deepseek-chat对应非思考模式,Deepseek-reasoner对应思考模式,且上下文均已扩展为128K。API调用价格:输入0.5元/百万tokens(缓存命中)、4元/百万tokens(缓存未命中),输出12元/百万tokens,价格将于9月6日0时生效。具体表现来看:1)工具调用/智能体支持增强:编程智能体:在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中得分相比之前明显提高,DeepSeek-V3.1在多项搜索评测指标上取得了较大提升;搜索智能体:在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1性能已大幅领先R1-0528;2)思考效率提升:测试结果显示经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平,非思考模式相比DeepSeek-V3-0324能够在输出长度明显减少的情况下保持相同的模型性能。
催化国产算力板块,加速AI Agent商业化应用
DeepSeek V3.1发布后即带动国产算力产业链标的大幅上涨,芯片代工、半导体设备端、华为算力供应链均表现良好。DeepSeek表示DeepSeek V3.1使用UE8M0FP8Scale参数精度,这是针对即将发布的下一代国产芯片设计,未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。DeepSeek V3.1在AI Agent能力端显著提升,未来将继续推动AIAgent商业化场景应用。
我们认为,DeepSeek作为国产顶尖大语言模型新发布V3.1版本,长期来看有望拉动国内算力需求,助力国产算力生态加速建设,赋能垂类大模型研发,利好AI Agent商业化应用。相关公司:神州数码、寒武纪、品高股份、北京利尔、安博通、优刻得、浪潮信息、紫光股份、超讯通信、首都在线等。
风险提示
1)下游预算限制信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响科技产业发展。
