(以下内容从上海证券《计算机行业周报:国产大模型进步显著,北美云巨头capex预期乐观》研报附件原文摘录)
市场回顾
过去一周(5.6-5.10)上证综指上涨1.60%,创业板指上涨1.06%,沪深300指数上涨1.72%,计算机(申万)指数下跌3.24%,跑输上证综指4.84pcts,跑输创业板指4.30pcts,跑输沪深300指数4.95pcts,位列全行业第31名。
周观点
国产大模型进步显著,开始卷价格。(1)DeepSeek:5月6日,幻方旗下DeepSeek发布开源MoE模型DeepSeek-V2,中文综合能力开源模型中最强,与GPT-4-Turbo、文心4.0等闭源模型在评测中处于同一梯队;英文综合能力与最强的开源模型LLaMA3-70B同处第一梯队,超过最强MoE开源模型Mixtral8x22B;知识、数学、推理、编程等榜单结果也位居前列,并支持128K上下文窗口。DeepSeek-V2API的定价为每百万tokens输入1元、输出2元(32K上下文),价格仅为GPT-4-Turbo的近百分之一,性价比极高。模型通过使用MLA(Multi-head Latent Attention)架构,大幅减少计算量和推理显存,自研Sparse结构DeepSeekMoE则进一步将计算量降低到极致,两者结合最终实现模型性能跨级别的提升。(2)通义千问:5月9日,通义千问2.5正式发布,闭源赶超GPT-4Turbo、开源击败Llama-3-70B。与通义千问2.1版本相比,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%;与GPT-4相比,中文语境下,通义千问2.5文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力赶超GPT-4。同时,阿里云也发布了最新款开源模型1100亿参数的Qwen1.5-110B,在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型,在HuggingFace推出的开源大模型排行榜OpenLLMLeaderboard上位列榜首。通义千问大模型持续推进行业落地,目前已通过阿里云服务企业超9万、通过钉钉服务企业超过220万,通义开源模型累计下载量突破700万,现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。(3)智谱GLM:5月11日,智谱AI宣布GLM-3Turbo模型调用价格由5元/百万tokens调整为1元/百万tokens,此外包括GLM-3Turbo在内的GLM系列将迎来更新,正在部分开放测试中。我们认为,随着国产大模型的不断迭代优化以及性价比的持续提升,国产大模型竞争力将有效增强,有利于国内AI应用的落地。
北美云巨头capex预期乐观,国内算力开始兑现业绩。微软、谷歌、Meta、亚马逊CY1Q24合计资本支出467亿美元,四大云厂商均计划继续扩大AI投资规模,我们认为,资本支出将逐季增长。TrendForce此前预测,2024年四大云厂商占全球AI服务器需求超60%。Meta AI主管证实Meta为购入英伟达GPU已经花费了300亿美元,另一边微软和OpenAI要打造的星际之门花费1000亿美元,谷歌的投入想必也不会少。我们认为,AI军备竞赛仍在继续,AI算力仍然是AI产业中景气度和业绩兑现度较高的方向。国内算力链相关公司Q1业绩亮眼,浪潮营收176亿,yoy+85%,净利润3亿,yoy+64%;新华三营收121亿,yoy+14%,净利润8亿,yoy+8%;工业富联营收1187亿,yoy+12%,净利润42亿,yoy+34%。后续AI催化包括5月的谷歌I/O大会、微软Build2024大会、英伟达财报发布、6月的WWDC苹果开发者大会。
投资建议
建议关注:(1)AI算力:工业富联、中科曙光、浪潮信息、软通动力、神州数码、拓维信息、海光信息、寒武纪、景嘉微等;(2)AI应用:科大讯飞、金山办公、万兴科技、同花顺、佳发教育、新致软件、鼎捷软件、焦点科技等。
风险提示
下游景气度不及预期;政策推进不及预期;技术创新不及预期、行业竞争加剧。