(以下内容从万联证券《AI产业系列深度报告(一):生成式AI多领域落地,赋能传媒行业发展》研报附件原文摘录)
行业核心观点:
生成式人工智能(GenerativeAI),指的是通过人工智能技术自动生成内容的生产方式。着重于创造新的、有创意的数据,其关键原理在于学习和理解数据的分布,进而生成具有相似特征的新数据。自“十三五”、“十四五”规划将人工智能作为重点任务,明确了战略发展目标之后,国家陆续出台指导性及支持性政策推动生成式AI发展,目前在图像、文本、音频、视频等多种领域都有广泛的应用。
投资要点:
图像生成:Midjourney稳住行业龙头地位,AI文生图迈向多模态融合。AI文生图,即通过人工智能技术解析文字描述内容,提取关键信息,利用深度学习模型形成草图,再经过优化算法细化图像细节,增强图像质量,输出符合描述的视觉内容,是近年来快速发展的一项技术。
1)自身发展,自2023年起,图像生成已经在摄影艺术、设计、二次元、CG艺术和影视制作等多个行业得到广泛应用,目前该技术不仅限于单一的图像生成模型,而是开始向多模态融合方向发展,市场规模高速增长,网民参与度显著提升;
2)产品,目前市场上的产品已经发展比较成熟,主流的AI文生图工具分别有MidjourneyV6、AdobeFirefly3、StableDiffusion3、Dalle3等。Midjourney产品迭代速度快于同行,整体图像产出质量显著提高,同时通过庞大的用户量及用户数据,使得积累的数据集具有独家性,并依托这些数据进行反复训练,来构建自我艺术风格,巩固自身竞争优势,稳住文生图龙头地位。
视频生成:新品推出受到市场关注,创新点赋能行业发展。AI文生视频的本质是能够根据输入的文本描述自动生成相应的视频内容。这项技术结合了自然语言处理(NLP)、计算机视觉、图像生成和动画技术等多个领域的研究成果,通过训练大量文本和视频数据,依靠文本解析、图像生成、动态渲染等核心技术,将文字转化为图像,并赋予这些图像动态效果,全自动化形成视频文件。
1)自身发展,技术更迭带动行业发展,真正兴起点在于将扩散模型在文生图领域经验拓展至文生视频,成为AI视频生成领域的主流技术路径,带动行业产品推出频率及数量显著提升,但由于存在缺乏相符性高的训练数据、计算成本高昂、信息冗杂难处理等挑战,目前市场仍处于初期阶段,潜力可期;
2)产品,目前市场上受到关注度较高的文生视频产品分别是来自OpenAI的Sora、Pika1.0、近期快手推出的可灵、LumaAI推出的DreamMachine以及Runway推出的GEN-3。新品的推出通常伴随着领域技术的突破,从目前的文生视频能力来看,已经具备了一定的产业生产力,未来将赋能影视产业链,为其降本增效提供助力。
音频生成:音乐生成类市场潜力大,企业探索视频生音频技术。AI音频利用先进的人工智能技术和复杂算法来创造音频内容,包括语音合成、音乐制作和声音效果合成等。通过融合机器学习和深度学习算法,AI音频生成技术能够精确地模仿人类的语音、音乐节奏和声音效果,生成自然且逼真的音频,广泛应用于娱乐、广告、教育和新闻传播等多个领域。
1)自身发展,AI音频生成行业的产业链以中游AI音频算法和服务平台为核心,上下游协同发展,从应用场景来看,语音合成占主导,音乐生成潜力大,语音识别应用成熟;
2)产品,标杆性的音乐生成类音频AI是由SunoAI研发的Suno系列产品,于今年5月推出了V3.5版本,维持了与OpenAI合作,一次性完成歌词、演唱、编曲、配乐等全部流程,领先于市面上单纯生成音乐的同类型产品,同时关注到ElevenLabs及GoogleDeepMind均宣布了自动匹配画面AI生成音效产品,即无需人工输入提示词也可以为视频配音,实现真正的AI音频及AI视频合作,这将带领文生视频迈入有声时代,实现行业再突破,双向促进市场繁荣发展。
传媒行业应用:AI赋能传媒子行业,助力技术变革。在影视、游戏等多个传媒互联网的细分领域进行广泛应用,从而提升内容生产效率,降低内容生产成本,助力行业变革,建议关注已有生成式AI应用落地的公司。
1)游戏方面,生成式AI能压缩游戏整体项目的研发周期与人员规模,大幅降低游戏制作成本,降本增效;对已有的游戏进行产品更新升级,实现真正的人与AI的互动,优化游戏体验;对电竞行业进行数字化创新;营销买量制作周期缩短,缩减营销成本;
2)广告营销方面,生成式AI内容生产能力契合广告营销需求,从获取广告创意、进行内容生成、后期进行广告投放,最后实现高效的消费转化,有望显著提升营销内容生产效率,同时降低优质营销内容生产门槛;
3)影视方面,生成式AI从剧本制作、影视制片、导演拍摄、后期制作以及宣发营销五大环节对整体影视制作提供助力,大幅缩短创意落地实现的时间成本,也降低了影片创作的人力成本,显著提高工作效率。
风险因素:政策环境变化;市场竞争加剧;创新技术应用不及预期;AI版权及知识侵权风险;市场需求的不确定性;违规违法风险。