传媒行业点评报告：Pika、Gemini多模态AI不断突破，AI应用或加速_股票频道

（以下内容从开源证券《传媒行业点评报告：Pika、Gemini多模态AI不断突破，AI应用或加速》研报附件原文摘录）
Pika 1.0 AI 视频生成能力领先，或引领 AI 视频热潮，持续利好 IP 开发领域
11 月 29 日，美国 AI 初创公司 Pika labs 发布了 Pika 1.0，这款产品能够生成和编辑 3D 动画、动漫、卡通和电影，且制作视频门槛较低，用户只需要输入一句话，就可以生成想要的各种风格的视频，并通过简单的描述，更改视频中的形象和风格。目前 Pika 1.0 的功能包括：文本生成视频、图像生成视频、视频风格转换、对视频内容进行编辑。在文生视频方面， Pika 动画生成的清晰和连贯性强，且具有优秀的语义理解能力，可以直接输入文字来生成不同内容和不同风格的 AI 视频。除了图生视频， Pika 还支持视频生成视频，同时可以直接修改视频中的局部内容以及视频尺寸。我们认为， Pika 1.0 的推出是 AI 视频生成产品的一次重大升级，或大幅提高 AI 视频生产效率，正式开放后有望引领 AI 视频热潮，同时推动音乐、动画、影视等 IP 开发大幅降本增效，打开收入增量空间。
谷歌发布 Gemini，多模态能力或超 GPT-4，有望进一步拓展应用场景
12 月 7 日，谷歌发布了 AI 大模型 Gemini，作为多模态大模型， Gemini 可以同时识别和理解文本、图像、音频、视频和代码五种信息，且对信息的理解非常精准。 Gemini 包含三个版本：适用于高度复杂任务的 Gemini Ultra、适用于各种任务的最佳模型 Gemini Pro 以及适用于端侧设备的 Gemini Nano。 Gemini Ultra 是首个在 MMLU 任务上表现优于人类专家的大模型，取得 90.0%的成绩。作为对比，人类专家的成绩为 89.8%， GPT-4 为 86.4%。从测评数据上来看， Gemini的性能在多模态任务上全面超越 GPT-4V，或进一步拓展多模态大模型的应用场景。此前， OpenAI 于 11 月份发布了 GPT-4 Turbo 且开放了 GPTs，谷歌紧随其后发布了 Gemini，海外科技巨头之间多模态大模型的竞争日益激烈，同时驱动着底层多模态大模型的能力不断突破，叠加 GPTs 等 AI 应用形式的出现， AI 应用有望迎来快速增长期。
AI 应用或加速落地并开启商业化，加码布局 AI 应用
我们认为，以 Pika 1.0 和 Gemini 为代表的 AI 多模态模型不断突破，或推动大模型在工具、教育、办公、电商、营销等领域的应用加快落地并打开商业化空间。建议继续布局 AI 应用的两个方向：一是已推出产品并开启商业化的 AI 应用领域：工具、教育、音乐、校对、营销等；二是将受益于 AI 视频生成等 AI 多模态模型的游戏、影视等 IP 开发领域。（1）“AI+工具” 受益标的为昆仑万维。（2）“AI+教育” 受益标的为世纪天鸿。（3）“AI+音乐” 重点推荐盛天网络。（4）“AI+校对/动画” 受益标的为果麦文化。（5）“AI+游戏” 受益标的为掌趣科技。（6）“AI+营销/虚拟人” 受益标的包括蓝色光标、因赛集团、元隆雅图、引力传媒等。（7）“AI+IP/影视/视频” 受益标的包括上海电影、奥飞娱乐、中文在线、华策影视、捷成股份、万兴科技、易点天下等。
风险提示：多模态大模型技术发展不及预期； AI 应用商业化进展不及预期。

证券之星微信

扫描二维码

关注

证券之星微信