(以下内容从德邦证券《计算机行业周报:小米发力AI,加码模型和端侧》研报附件原文摘录)
投资要点:
小米在AI耕耘多年,全力拥抱生成式AI发展浪潮。小米创始人/董事长雷军表示,在AI团队建设方面,小米自2016年组建AI团队以来,到2023年4月第一时间成立专职大模型团队,经过多次扩展,小米AI团队相关人员规模已达3000多人,逐步建立了视觉、语音、声学、知识图谱、NLP、机器学习、多模态等AI技术能力。目前,小米不断加码AI人才与资金投入,对未来AI与算力发力愈发明显。人才方面,据第一财经去年12月报道,DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米AI实验室,领导小米大模型团队;算力方面,据界面新闻,小米正在着手搭建自己的GPU万卡集群,将对AI大模型大力投入。小米大模型团队在成立时已有6500张GPU资源;研发投入方面,在去年12月举行的小米人车家全生态合作伙伴大会上,小米集团总裁卢伟冰表示,预计2024年小米研发费用将达到240亿元,2025年更是将攀升至300亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。
小米大模型主攻轻量化、本地部署,二代大模型MiLM2全面提升云、端大模型能力。2023年,小米凭借独特的技术洞察,开创性地提出了将"轻量化、本地部署"作为突破点,业界第一个在手机芯片NPU上跑通十亿参数规模大语言模型,验证了端侧小模型在部分目标场景可以取得媲美云端大模型的效果。2024年11月,小米大模型已经实现了从一代到二代(MiLM2)的升级迭代:1)第二代大语言模型丰富了模型的参数矩阵,参数规模同时向下和向上扩充,实现了云边端结合,参数尺寸最小为0.3B,最大为30B;在10大能力维度上,相比于第一代模型平均提升超过45%,其中指令跟随、翻译、闲聊等对于智能助手而言比较关键的能力上,效果处于业界前列;在端侧部署上支持3种推理加速方案,包括大小模型投机、BiTA、Medusa,并且自研量化方案相比于业界标准高通方案,量化损失降低78%;支持的最长窗口为200k(第一代为4k),在长文本评测中,效果处于业界前列。
小米大模型力图与自身业务深度协同,云边端结合模型矩阵赋能“人车家全生态”。
MiLM2模型矩阵主要在参数规模和模型结构两个方面打造纵深,目的是为了适应多元化的业务场景并在小米生态中挖掘更多的落地场景。大模型的参数规模灵活扩展至0.3B、0.7B、1.3B、2.4B、4B、6B、13B、30B等多个量级,以适应不同场景下的需求,其中4B模型端侧落地,30B模型云端部署。小米的AI技术能力已逐步接入手机、汽车、AIoT、机器人等业务板块,端侧赋能加速。2023年10月,小米发布全球首个人车家全生态操作系统澎湃OS,60亿参数自研大模型在端侧部署运行,部分场景性能媲美极大参数量云端大模型;2024年10月,小米发布澎湃OS2,带来三项核心技术革新——HyperCore、HyperConnect、HyperAI,升级后的HyperAI,将端云大模型矩阵、多设备端侧感知、跨端执行能力全面整合,拥有更多AI功能,包括AI写作、AI识音、AI字幕,以及小米平板上可使用的AI妙画等;此外,小米还推出了全生态AI智能助手——超级小爱,利用多模态能力,简化用户面对海量设备时复杂的操作,打通感知-理解-执行的全链路操作。
投资建议。建议关注小米链相关公司:小米集团、金山云、金山办公、世纪互联、金山软件、虹软科技、寒武纪、海光信息、恒玄科技、火炬电子、润欣科技、中微半导等。
风险提示:技术落地不及预期、AI端侧渗透不及预期、算力采购不及预期等。
