(以下内容从上海证券《互联网传媒行业周报:周观点:MMICL支持多模态混合输入,苹果支持3A主机游戏》研报附件原文摘录)
主要观点
9月11日,继各类单一模态输入的多模态语言模型后,新加坡国立大学的华人团队最近开源了全能多模态模型NExT-GPT。该模型支持任意模态的输入和输出,可以实现文本、图像、语音和视频之间的自由转换,是第一个实现从任一模态到任一模态转换的通用多模态系统。NExT-GPT的优势在于:1)支持任意模态的输入和输出,充分模拟了人类处理信息的能力,是向通用人工智能目标迈进的重要一步;2)通过组合优化利用现有的各类开源模块实现全能目标。
9月19日,北京大学、北京交通大学等单位或机构联合开源发布多模态大模型MMICL,在MMbench和MME榜单目前浮动排名均保持在前三位。MMICL最大的特色在于同时接受文本和图像的交错输入,它可以分析两张图像的关系,也可以从视频中提取时空信息。目前MMICL已开源两个版本,分别基于FlanT5XL和Vicuna模型,可满足商用和科研需求。MMICL拥有理解推理多幅图像间关系、类比推理、支持实时视频流输入等核心功能,可有效应对复杂的多模式快速理解的挑战。
根据我们“大模型+小模型+应用&内容”的研究框架,我们认为国内大模型行业的发展已经从原本追赶补齐大模型能力的阶段,来到了同时推进商业化、尝试规模落地的阶段。
(1)多模态AI应用场景及用户需求结合紧密,在大模型赛道热度略有下降的情况下,多模态AI给人的想象空间较大。NExT-GPT作为一个端到端的多模态大模型,已具备多模态AI的雏形,逐步迈向完全体AI的道路。MMICL具备处理复杂多模态输入的能力,支持各种多模态任务精调,开源发布为多模态AI的研究和应用提供了新的选择。
(2)苹果2023年秋季发布会宣布将主机3A游戏引入iOS手游,iPhone平台将从单一的手游领域跳脱成为容纳手游、主机游戏的全能移动平台,逐步实现对手游、主机/PC游戏的“大一统”,依托于自研A17Pro芯片的高性能及光追功能,苹果将把3A游戏移植进iOS平台,打造全能的移动游戏平台。
目前AIGC行情已有所分化,未来主题性机会有望逐步切换向案例兑现、甚至基本面兑现,高质量的在研或运营跨平台游戏项目需重点关注,持续推荐具备基本面优势的【游戏板块】。
投资建议
基于我们“大模型+小模型+应用及内容”的研究框架,我们认为从基本面受益的角度上看,需沿着目前成熟大模型模态输出的范围选择标的,重点关注AI+文本/虚拟人板块,其次关注AI+图片(大模型+小模型);从价值重估的角度上看,需沿着掌握优质数据或内容(多模态数据)的范围选择标的,重点关注AI+内容/IP/版权板块。
AI行情分化趋势下,建议重点关注基本面优异的【游戏】及【出版】板块:
1、建议关注AI+游戏,如【盛天网络】、【姚记科技】、【神州泰岳】、【三七互娱】、【完美世界】、【吉比特】、【世纪华通】、【巨人网络】;建议关注AI+出版,推荐【皖新传媒】、关注【中文传媒】、【中国科传】、【中国出版】等。
2、建议关注行业垂类大模型,如【创业黑马】、【昆仑万维】。
3、推荐中国版Discord【创梦天地】。
4、建议关注【汇纳科技】、【引力传媒】、【浙文互联】、【世纪恒通】。
风险提示
政策边际优化的程度不及预期、疫情致企业经营情况不及预期、AI推进进度不及预期、AIGC商业模式或落地场景效果不及预期、内容监管趋严。