(以下内容从上海证券《互联网传媒行业周报:周观点:Stable Diffusion 3可通过API使用,百度举办AI开发者大会》研报附件原文摘录)
主要观点
4月18日,Stability.ai在官网宣布最新文生图模型Stable Diffusion3(简称“SD3”)和SD3Turbo可以在API中使用。与前两代相比,SD3除了生成的图片质量更高之外,可以更好地理解提示文本中嵌入到图片中的文字。Stability.ai2月22日在官网首次展示了SD3并开启候补测试,3月5日在arxiv上公布了其论文并介绍,SD3与前两代相比最大技术创新在于使用了MM-DiT和Flow Matching两种方法来增强模型的输出、训练、优化等,同时支持文本或图像作为提示实现多模态能力。通常多数文生图模型在生成的过程中,只考虑图像本身而没有充分利用文本信息,所以,输出结果时经常出现“驴头不对马嘴”的情况,甚至是一些无法理解的乱码或者扭曲的图像。而MM-DiT通过结合Transformer的自注意力机制强大的文本和图像序列处理能力,帮助模型在生成图像时能与文本实现更好的匹配。当用户输入文本或图像提示时,首先被转换为嵌入表示。文本通过预训练的文本模型编码,而图像则通过预训练的自动编码器转换为潜在空间表示。
4月16日,Create2024百度AI开发者大会在深圳举办。百度创始人、董事长兼首席执行官李彦宏发表了题为《人人都是开发者》的主旨演讲。他认为,AI正在掀起一场创造力革命,未来开发应用就像拍短视频一样简单,人人都是开发者,人人都是创造者,大模型和生成式AI将彻底改变开发者群体。百度已经为开发者们准备好了三大“开箱即用”的工具,包括智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder,这三个工具都代表了先进生产力。此外,百度正式发布了文心大模型4.0的工具版,开发者可通过文心4.0降维裁剪出来的更小尺寸模型,在同等尺寸下,比直接拿开源模型调出来的效果更好;在同等效果下,成本更低。
在10亿互联网用户的基础下,国内大模型拥有足够的AI应用场景和产业体系。我们认为在国家“人工智能+”政策的支持和鼓励下,个人和企业可充分利用大模型工具,释放无限创造力和生产力。在大语言模型百花齐放阶段,我们认为国内大厂持续投入大语言模型,有望打造出更适合中国的AI生产力工具。目前AIGC行情已有所分化,未来主题性机会有望逐步切换向案例兑现、甚至基本面兑现,龙头及龙头板块需重点关注,持续推荐具备基本面优势的【游戏】板块。
投资建议
基于我们“大模型+小模型+应用及内容”的研究框架,我们认为从基本面受益的角度上看,需沿着目前成熟大模型模态输出的范围选择标的,重点关注AI+文本/虚拟人板块,其次关注AI+图片(大模型+小模型);从价值重估的角度上看,需沿着掌握优质数据或内容(多模态数据)的范围选择标的,重点关注AI+内容/IP/版权板块。
AI行情分化趋势下,建议重点关注基本面优异的【游戏】及【出版】板块:
1、AI:关注【昆仑万维】;推荐【创业黑马】。
2、MR:推荐【风语筑】;关注【宝通科技】。
3、游戏新模式:推荐【盛天网络】、【完美世界】、【三七互娱】。
4、影视新模式:关注【中文在线】、【上海电影】、【光线传媒】、【华策影视】。
风险提示
政策边际优化的程度不及预期、AI推进进度不及预期、AIGC商业模式或落地场景效果不及预期、内容监管趋严。