(以下内容从上海证券《计算机行业周报:Llama 3发布,开源大模型迎重要进展》研报附件原文摘录)
市场回顾
过去一周(4.15-4.19)上证综指上涨1.52%,创业板指下跌0.39%,沪深300指数上涨1.89%,计算机(申万)指数下跌3.94%,跑输上证综指5.45pct,跑输创业板指3.55pct,跑输沪深300指数5.83pct,位列全行业第25名。
周观点
Llama-3正式发布,开源大模型迎来新进展。4月18日,Meta正式发布了开源大模型——Llama-3。据悉,Llama-3共有80亿、700亿两种参数,分为基础预训练和指令微调两种模型。Llama3的主要亮点包括:(1)基于超过15T token训练,相当于Llama2数据集的7倍还多;(2)支持8K长文本,改进的tokenizer具有128K token的词汇量,可实现更好的性能;(3)在大量重要基准中均具有最先进性能,Llama38B在MMLU、GPQA、HumanEval、GSM-8K等多项基准上超过谷歌Gemma7B和Mistral7B Instruct,Llama370B也在MMLU、HumanEval、GSM-8K等基准上超越了闭源的谷歌GeminiPro1.5、Claude3Sonnet;(4)新能力范畴,包括增强的推理和代码能力;(5)训练效率比Llama2高3倍;(6)带有Llama Guard2、Code Shield和CyberSec Eval2的新版信任和安全工具。基于最新的Llama3模型,Meta的AI助手现在已经覆盖Instagram、WhatsApp、Facebook等全系应用,并单独开启了网站。另外还有一个图像生成器,可根据自然语言提示词生成图片。此外,Llama3系列最大模型规模将超过4000亿参数,目前正在训练中,英伟达科学家Jim Fan认为,这一版本未来的推出将意味开源社区的一个分水岭,开源模型将一举翻越GPT-4这一高峰。
Create2024百度AI开发者大会召开,“开箱即用”降低AI应用开发门槛。4月16日,百度举办了Create2024百度AI开发者大会,会上发布了一个强大的基础模型系列和三大AI开发工具,并将它们组成了一个工具箱,支持开发者打包带走,随取随用。强大的基础模型系列,文心大模型系列,包括:旗舰版的ERNIE3.5和4.0,和轻量版的ERNIE Speed、Lite、Tiny等;正式发布文心大模型4.0的工具版。模型算法的训练效率提升至原来的5.1倍,周均训练有效率达到98.8%,推理性能提升105倍,推理的成本降至原来的1%。三大“开箱即用”的AI开发工具,包括智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder,代表了先进生产力。生态持续扩张,文心一言自23年3月16日发布,截止目前用户数、API日均调用量均突破2亿,服务客户数达8.5万,利用千帆平台开发的AI原生应用数超过19万。目前,文心大模型已成为中国最领先、应用最广泛的AI基础模型。我们认为,在强大的基础模型、开箱即用的开发工具以及繁荣的生态赋能下,AI原生应用的未来发展值得期待,带来AI生产力、创造力的持续变革。
投资建议
建议关注:(1)AI算力:工业富联、中科曙光、浪潮信息、软通动力、神州数码、拓维信息、海光信息、寒武纪、景嘉微等;(2)AI应用:科大讯飞、金山办公、万兴科技、同花顺、佳发教育、新致软件、鼎捷软件、焦点科技等。
风险提示
下游景气度不及预期;政策推进不及预期;技术创新不及预期、行业竞争加剧。