(以下内容从国金证券《计算机行业研究:OpenAI Shipmas Day3:Sora Turbo正式发布,视频版GPT-1时刻到来》研报附件原文摘录)
事件概览
2024年12月10日凌晨,OpenAI进行“Shipmas”活动的第三天直播,发布正式版Sora Turbo。新版Sora可生成最高1080p分辨率、最长20秒、宽屏、竖屏或方形的视频。用户可以利用资源进行扩展、remix、融合,也可基于文本生成全新的内容。OpenAI开发了全新的UI界面,并提供故事板工具让用户可以精准地指定每个帧的输入。OpenAI CEO Sam Altam表示“大家可以将Sora看作视频版的GPT-1”。
投资逻辑
全新UI界面提供多种编辑功能,视频可用性极大提升。具体功能包括:1)Remix:可以替换、删除或重新构想视频中的元素;2)Re-cut:支持找到并隔离最佳帧,并向任一方向延伸以完成场景;3)Storyboard:支持在时间线上组织和编辑视频的独特序列;4)Loop:剪辑并创建无缝重复的视频;5)Blend:将两个视频合并为一个无缝剪辑;6)Style presets:创建和分享激发用户想象力的风格。
OpenAI发布正式版系统卡(system card),公开更多技术细节。Sora是建立在DALL?E和GPT基础上的一种扩散模型,它从看起来像静态噪声的基本视频开始生成新视频,通过多个步骤消除噪声来逐渐进行转换。通过每次为模型提供多帧预测,Sora能够确保画面主体即使暂时离开视野也能保持不变。因此,Sora能够更忠实地遵循生成视频中用户的文本指令。
目前新版Sora的单视频平均生成价格约0.4美元,作为独立产品提供给ChatGPT Plus和Pro用户。Plus会员(20美元)每月最多可生成50支视频,720p/480p分辨率视频最长生成长度为5s/10s;Pro会员(200美元)每月可生成5000支视频,支持1080p、20s、并发5代,支持人像视频生成、无水印下载。目前Sora尚不支持团队、企业及教育用户使用。
投资建议
OpenAI代表全球AI技术最前沿,其最新发布成果可以指引国内大模型训练及应用落地方向。RFT可提升垂域小模型训练效率,有望快速打造Agent。建议关注大模型持续更新且具备充足算力储备的科大讯飞、商汤-W;多模态技术成熟、推进应用出海的万兴科技;在办公、教育领域与AI技术结合的金山办公、竞业达等。
风险提示
AI技术发展不及预期的风险;政策推进节奏不及预期的风险;算力不足的风险;国际关系风险;监管风险。