(以下内容从中国银河《计算机行业行业点评报告:OpenAI发布文生视频模型Sora,加速迈进AGI时代》研报附件原文摘录)
核心观点:
事件:北京时间2月16日凌晨,OpenAI发布了首个文生视频模型Sora,可以用文字指令生成长达60秒的高清流畅视频,在生成视频长度、连贯性、多镜头切换方面具备显著优势。
Sora基于DALL-E与GPT框架,AGI(通用人工智能)迎来里程碑。我们认为,简单来说,Sora继承并结合OpenAI的DALL-E与GPT模型而打造的强大文生视频模型:1)基于DALL-E3Diffusion架构:Sora与DALL-E一样采用扩散型架构,即将一个随机噪声通过去噪过程来生成视频;2)基于GPTTransformer架构:Sora同样采用Transformer架构,与GPT通用语言大模型将文本转换为可被理解的Token类似,Sora将视频转换成一系列Patch(视觉编码块)并将其进行降维,用Patch作为视觉图像统一表现形式。Sora达到理解世界运动与物理运动,已经初具模拟真实世界与物理运动能力,这将是人类迈向AGI的关键一步。
文生视频技术史诗级突破,元宇宙或迎“第二春”。Sora可以将简短文本描述转换成一分钟流畅视频,相对于Runway、Pika、Stable Video等提升了几个代级,1)视频长度相对传统视频生成工具提升15-20倍;2)视频质量、清晰度更高;3)可实现多镜头切换;4)连贯性与稳定性更好;5)支持多种数据格式输入,具备实现文生视频、图生视频、视频扩展能力。我们认为,Sora是“数据驱动的物理引擎”,将在元宇宙发展进程中起到关键性作用,并将推动元宇宙进入下一阶段,一方面,Sora能根据需求打造虚拟空间,快速搭建元宇宙虚拟场景;另一方面,Sora可以通过模拟世界及物理运动进一步探索虚拟时空。
推升算力基础设施需求,重点关注推理侧算力及通信端。我们认为,Sora强大的文生视频能力将快速推进应用端商业化落地、拉动产业规模,进而传导到上游算力基础设施,算力基础设施需求将再次迎来爆发。目前OpenAI已加入算力芯片军备竞赛中,根据OpenAI论文,推理阶段算力需求是模型参数数量与训练数据集规模乘积的2倍,Sora将推动推理端算力占比将大幅提升。此外,通信端等配套实施需要全方位升级,网络上行下载速度需大幅提升以应对大量推理端传输需求,800G、1.6T光模块有望持续放量。
投资建议:Sora是人工智能发展进程中的“里程碑”,预示AGI将加速到来,未来千行百业将颠覆式变革,建议重点关注国内上市公司:1、国内多模态大模型:科大讯飞、海康威视、大华股份;2、算力基础设施:工业富联、中科曙光、软通动力、神州数码、曙光数创、润泽科技、拓维信息;3、AI应用端:万兴科技、金山办公、彩讯股份、拓尔思、卫宁健康、嘉和美康等。
风险提示:技术研发进度不及预期风险;供应链风险;政策推进不及预期风险;消费需求不及预期风险;行业竞争加剧风险。