首页 - 股票 - 研报 - 行业研究 - 正文

传媒行业点评报告:多模态模型再迎新突破,继续布局AI应用及算力

来源:开源证券 作者:方光照,田鹏 2024-02-18 10:03:00
关注证券之星官方微博:
(以下内容从开源证券《传媒行业点评报告:多模态模型再迎新突破,继续布局AI应用及算力》研报附件原文摘录)
OpenAI发布首个文生视频模型Sora,可输出长达60秒的视频
2月16日凌晨,OpenAI发布了首个文生视频模型Sora。Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。整体来看,Sora生成的视频噪音比较少,原始的训练数据比较“干净”,而且基于ChatGPT、DALL·E文生图技术能力,Sora视频生成技术更加高超。此外,OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。
谷歌发布Gemini1.5,多模态能力大幅增强
2月16日,谷歌宣布推出Gemini1.5。谷歌现在推出的是用于早期测试的Gemini1.5的第一个版本-Gemini1.5Pro。它是一种中型多模态模型,针对多种任务的扩展进行了优化,其性能水平与谷歌迄今为止最大的模型1.0Ultra类似。谷歌增加了1.5Pro的上下文窗口容量,该大模型现在可以在生产环境中运行多达100万个token。这意味着1.5Pro可以一次性处理大量信息,包括1小时的视频、11小时的音频、超过3万行代码或超过70万个单词的代码库。1.5Pro可以在给定提示内无缝分析、分类和总结大量内容。例如,当给出阿波罗11号登月任务的402页记录时,它可以推理整个文档中的对话、事件和细节。1.5Pro可以针对包括视频在内的不同模式执行高度复杂的理解和推理任务。例如,当给定一部44分钟的巴斯特?基顿无声电影时,该模型可以准确分析各种情节点和事件,甚至推理出电影中容易被忽略的小细节。Gemini1.5Pro在扩大上下文窗口后,依然保持了高水平的性能。
支持AI视频生成的多模态模型不断突破,继续布局AI应用及算力
当前AI技术已迅速越过文生文和Chatbot阶段,大举进入视频生成领域。从Pika、Gemini1.0到Sora和Gemini1.5,支持AI视频生成的AI多模态模型不断突破,特别是Sora能够理解和模拟现实世界的模型基础,有望成为实现AGI的重要突破节点。AI视频生成等多模态模型有望在影视、动画、游戏、音乐等IP开发中发挥更大作用,继续推动IP开发降本增效,带来增量变现空间,并拉动算力需求。建议布局AI应用及算力方向:(1)AI+影视/动画IP重点推荐芒果超媒、阅文集团、奥飞娱乐,受益标的包括上海电影、中文在线、华策影视、捷成股份等。(2)AI+游戏重点推荐盛天网络、恺英网络、神州泰岳、姚记科技、腾讯控股、网易-S、完美世界、吉比特、心动公司、创梦天地,受益标的包括星辉娱乐、掌趣科技、汤姆猫、宝通科技、巨人网络、游族网络、三七互娱等。(3)算力板块受益标的包括顺网科技、天娱数科、平治信息、浙数文化等。
风险提示:多模态大模型进展不及预期;大模型商业化落地进展不及预期。





微信
扫描二维码
关注
证券之星微信
APP下载
好投资评级:
好价格评级:
证券之星估值分析提示游族网络盈利能力较差,未来营收成长性较差。综合基本面各维度看,股价偏高。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-