(以下内容从开源证券《传媒行业点评报告:Pika、Gemini多模态AI不断突破,AI应用或加速》研报附件原文摘录)
Pika 1.0 AI 视频生成能力领先, 或引领 AI 视频热潮, 持续利好 IP 开发领域
11 月 29 日,美国 AI 初创公司 Pika labs 发布了 Pika 1.0, 这款产品能够生成和编辑 3D 动画、动漫、卡通和电影,且制作视频门槛较低, 用户只需要输入一句话,就可以生成想要的各种风格的视频,并通过简单的描述,更改视频中的形象和风格。 目前 Pika 1.0 的功能包括: 文本生成视频、图像生成视频、 视频风格转换、对视频内容进行编辑。 在文生视频方面, Pika 动画生成的清晰和连贯性强,且具有优秀的语义理解能力, 可以直接输入文字来生成不同内容和不同风格的 AI 视频。 除了图生视频, Pika 还支持视频生成视频,同时可以直接修改视频中的局部内容以及视频尺寸。 我们认为, Pika 1.0 的推出是 AI 视频生成产品的一次重大升级, 或大幅提高 AI 视频生产效率, 正式开放后有望引领 AI 视频热潮, 同时推动音乐、动画、影视等 IP 开发大幅降本增效,打开收入增量空间。
谷歌发布 Gemini,多模态能力或超 GPT-4, 有望进一步拓展应用场景
12 月 7 日, 谷歌发布了 AI 大模型 Gemini, 作为多模态大模型, Gemini 可以同时识别和理解文本、图像、音频、视频和代码五种信息,且对信息的理解非常精准。 Gemini 包含三个版本:适用于高度复杂任务的 Gemini Ultra、适用于各种任务的最佳模型 Gemini Pro 以及适用于端侧设备的 Gemini Nano。 Gemini Ultra 是首个在 MMLU 任务上表现优于人类专家的大模型,取得 90.0%的成绩。作为对比,人类专家的成绩为 89.8%, GPT-4 为 86.4%。 从测评数据上来看, Gemini的性能在多模态任务上全面超越 GPT-4V,或进一步拓展多模态大模型的应用场景。 此前, OpenAI 于 11 月份发布了 GPT-4 Turbo 且开放了 GPTs,谷歌紧随其后发布了 Gemini, 海外科技巨头之间多模态大模型的竞争日益激烈,同时驱动着底层多模态大模型的能力不断突破, 叠加 GPTs 等 AI 应用形式的出现, AI 应用有望迎来快速增长期。
AI 应用或加速落地并开启商业化, 加码布局 AI 应用
我们认为, 以 Pika 1.0 和 Gemini 为代表的 AI 多模态模型不断突破, 或推动大模型在工具、教育、办公、电商、营销等领域的应用加快落地并打开商业化空间。建议继续布局 AI 应用的两个方向: 一是已推出产品并开启商业化的 AI 应用领域:工具、教育、音乐、校对、营销等; 二是将受益于 AI 视频生成等 AI 多模态模型的游戏、影视等 IP 开发领域。(1)“AI+工具” 受益标的为昆仑万维。(2)“AI+教育” 受益标的为世纪天鸿。(3)“AI+音乐” 重点推荐盛天网络。(4)“AI+校对/动画” 受益标的为果麦文化。(5)“AI+游戏” 受益标的为掌趣科技。(6)“AI+营销/虚拟人” 受益标的包括蓝色光标、因赛集团、元隆雅图、引力传媒等。(7)“AI+IP/影视/视频” 受益标的包括上海电影、奥飞娱乐、中文在线、华策影视、捷成股份、万兴科技、易点天下等。
风险提示: 多模态大模型技术发展不及预期; AI 应用商业化进展不及预期。