(以下内容从山西证券《计算机行业点评:Sora正式上线,多模态模型的里程碑》研报附件原文摘录)
事件描述:
12月10日,OpenAI正式上线Sora,并向包括美国在内的多数国家用户开放,用户可在OpenAI官网上体验Sora。同时,Sora被包含在ChatGPTPlus和ChatGPTPro的会员订阅方案中,用户无需额外付费。其中,订阅Plus方案的用户可使用Sora生成最多50个分辨率达720p、时长为5秒的高级视频,而Pro方案能生成最多500个分辨率达1080p、时长为20秒的高级视频,并且提供去水印功能。
事件点评:
相较于OpenAI2月份发布的版本,此次上线的新Sora新增Storyboard、Remix、Re-cut等功能,视频再创作能力大幅提升,并且优化了视频生成速度及生成方式。新Sora的新功能包括1)Storyboard:类似于电影里的分镜,即用户只需借助文字设计几段视频帧或直接上传图片作为静态视频帧,并在视频帧之间预留一些时间供Sora发挥,Sora便能自动把这些视频帧串联起来形成一段完整的视频;2)Remix:通过不同的文字描述对视频中的元素进行替换、删除或重构,比如可以把图书馆变成宇宙飞船;3)Re-cut:智能识别并剪切出视频中的最佳帧,并将其导入Storyboard中,拓展该视频帧;4)Loop:用于创建无限循环的视频;5)Blend:将两个视频无缝合并为一个视频;6)Stylepresets:为视频预设风格,比如黑白电影、纸片人等。此外,借助SoraTurbo,新Sora的视频生成速度显著提升,同时,新Sora将视频生成方式扩展为文/文+图/文+视频生成视频。
今年以来,国内企业开始加速研发并迭代AI视频生成产品,产品能力不断提升,应用场景持续拓宽。1)今年6月,快手AI团队发布可灵AI视频生成大模型,可生成长达2分钟、分辨率达1080p的视频,可灵AI主要功能包括文生视频、图生视频、视频续写等;2)今年7月,智谱AI上线视
频生成产品智谱清影,并在11月进行全新升级,支持生成时长为10秒的4K超高清视频,除常规的文生视频和图生视频功能外,智谱清影引入CogSound模型,可以对为生成的视频添加背景音乐;3)今年8月,字节推出即梦AI一站式创作平台,随后在11月宣布即梦AI两大视频模型S2.0Pro和P2.0Pro正式全量上线,其中,S2.0Pro在图生视频场景具有较高的首帧一致性,能够保持视频与用户输入图像的色彩、风格等保持一致,P2.0Pro具有极高提示词遵循能力,能够在一句提示词内实现多个镜头切换及多镜头组合,同时保持视频内形象主体、风格和氛围的一致性。此外,Minimax、阿里云等初创企业及大模型厂商也在布局AI视频生成赛道,整体来看,视频生成工具的能力不断提升,未来有望渗透更多应用场景。
投资建议:Sora正式上线同时视频创作能力显著提升,开始从创作工具向生产力工具转变,随着以Sora为代表的AI视频生成工具持续迭代,未来其向多种应用场景的渗透有望加速。一方面,应用层我们建议重点关注创意、设计、教育等多模态特别是视频生成强相关的领域,相关标的包括万兴科技、美图公司、科大讯飞、海康威视、金山办公、虹软科技、焦点科技等;另一方面,视频生成模型对算力需求较文本显著提升,重点关注AI算力相关标的,包括寒武纪、海光信息、景嘉微、浪潮信息、紫光股份、中科曙光、工业富联、云天励飞、云赛智联、优刻得、青云科技等。
风险提示:AI技术发展不及预期,行业竞争加剧,下游需求不及预期。