首页 - 股票 - 研报 - 行业研究 - 正文

互联网传媒行业周报:字节、阿里推出图生视频AI生成器,谷歌上线多模态AI模型Gemini1.0

来源:上海证券 作者:陈旻 2023-12-12 10:31:00
关注证券之星官方微博:
(以下内容从上海证券《互联网传媒行业周报:字节、阿里推出图生视频AI生成器,谷歌上线多模态AI模型Gemini1.0》研报附件原文摘录)
11 月 27 日和 28 日,字节和阿里相继发布了图生视频项目相关论文,阿里推出了 Animate Anyone,新加坡国立大学和字节跳动则联合推出了 MagicAnimate。 Animate Anyone 由阿里巴巴智能计算研究院开发,通过优化的扩散模型让静态任务生成动态视频,创作者只需提供静态的角色图像(包括真人、动漫/卡通角色等)和一些动作、姿势(比如跳舞、走路)即可将其动画化,同时保留角色的细节特征(如面部表情、服装细节等)。 MagicAnimate 是新加坡国立大学和字节跳动联合推出的“人体图像动画生成器”,能够把指定的人物图片按照既定动作序列生成视频。在 TikTok 舞蹈数据集上, MagicAnimate 生成的视频的真实度比最强基线提高了超过 38%,用户只需三步即可使用: 1)上传一张静态人物照片; 2)上传想要生成的动作 demo 视频; 3)调整参数,点击“Animate”。字节和阿里的两个图生视频均通过扩散模型创造时间连贯的人像动画,训练数据大多相同。
12 月 5 日,南洋理工大学联合清华和商汤提出的 GaussianEditor 算法成功解决了 3D 编辑领域长时间和低可控性的问题,通过采用高斯溅射表示,引入高斯语义追踪和层次化高斯溅射,实现了精确可控的编辑 , 并 提 供 局 部 修 复 算 法 。 GaussianEditor 有 三 大 特 点 : 1)Gaussian 语义追踪:在训练过程中持续识别需要编辑的高斯点,确保只有目标区域被编辑。 2)层次化 Gaussian Splatting(HGS):通过在不同训练阶段形成的高斯点之间建立层次结构,有效管理 GS 场景的流动性,并模拟隐式表示中神经网络的缓冲功能。 3) 3D 场景的增加和删除算法:通过设计 3D 场景的增删算法,高效地从场景中移除或添加特定对象。 GaussianEditor 在视觉质量、量化指标、可控性和生成速度等方面超越了之前的工作,为未来虚拟现实和游戏开发提供了有力的工具。
12 月 6日,谷歌首席执行官 Sundar Pichai 和 DeepMind 负责人 DemisHassabis共同在官网宣布 Gemini 1.0正式上线。 功能方面, Gemini是一款新型的强大多模态人工智能模型, 1)可归纳、理解、操作、组合不同类型的信息, 2)处理文本、图像、视频和音频, 3)可完成复杂的数学、物理等科学领域任务,并能理解和生成各种编程语言的高质量代码。 扩展性方面, Gemini 1.0 设计了三个不同功能和尺寸版本:1) Gemini Nano 是端侧设备上最高效的模型,可以在没有连接外部服务器的情况下执行高效的 AI 处理任务,支持总结文本、智能回复等功能。 2) Gemini Pro 是运行在谷歌数据中心,适用于各种任务的最佳模型,为AI聊天机器人 Bard 提供支持,能够快速响应并理解复杂查询,目前为 170 多个国家和地区提供英语服务,应用于搜索、广告、Chrome 和 Duet AI 等更多谷歌产品。 3) Gemini Ultra 是规模最大且功能最强大的模型,专用于高度复杂的任务。
根据我们“大模型+小模型+应用&内容”的研究框架,我们认为多模态大模型是未来发展趋势: 相较于文字和图片,视频在信息表达、画 面丰富性及动态性方面有更大优势,视频可以结合文本、图像、声音及视觉效果,在单一媒体中融合多种信息形式。我们认为通过文本描述或其他简单操作, AI 视频工具即可生成较高质量和完成度视频内容,这降低了视频创作门槛,让创作者能够精准用视频进行内容展现,有望广泛赋能各细分行业的内容生产降本增效和创意输出,进而开拓出更广阔的应用场景。 目前 AIGC 行情已有所分化,未来主题性机会有望逐步切换向案例兑现、甚至基本面兑现,龙头及龙头板块需重点关注,持续推荐具备基本面优势的【游戏】板块。
投资建议
基于我们“大模型+小模型+应用及内容”的研究框架,我们认为从基本面受益的角度上看,需沿着目前成熟大模型模态输出的范围选择标的,重点关注AI+文本/虚拟人板块,其次关注AI+图片(大模型+小模型); 从价值重估的角度上看,需沿着掌握优质数据或内容(多模态数据)的范围选择标的,重点关注AI+内容/IP/版权板块。
AI行情分化趋势下,建议重点关注基本面优异的【游戏】及【出版】板块:
1、 建议关注AI+游戏,如【盛天网络】、【姚记科技】、 【神州泰岳】、 【三七互娱】、【完美世界】、【吉比特】;建议关注AI+出版,推荐【皖新传媒】。
2、建议关注行业垂类大模型, 如【创业黑马】、【昆仑万维】 。
3、建议关注短剧标的,如【三人行】、【中文在线】、【引力传媒】、【因赛集团】。
4、建议关注【汇纳科技】、【浙文互联】、【世纪恒通】。
风险提示
政策边际优化的程度不及预期、疫情致企业经营情况不及预期、 AI推进进度不及预期、 AIGC商业模式或落地场景效果不及预期、内容监管趋严。





微信
扫描二维码
关注
证券之星微信
APP下载
好投资评级:
好价格评级:
证券之星估值分析提示三七互娱盈利能力一般,未来营收成长性一般。综合基本面各维度看,股价偏低。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-