首页 - 股票 - 研报 - 行业研究 - 正文

计算机:AI:多模态加速,视频类惊艳,生态重要性凸显

关注证券之星官方微博:
(以下内容从中航证券《计算机:AI:多模态加速,视频类惊艳,生态重要性凸显》研报附件原文摘录)
谷歌Gemini性能测试完胜GPT-4,大模型多模态应用加速
根据澎湃新闻,当地时间12月6日,谷歌公司宣布推出据称“最大、最强、最通用”的新大型语言模型Gemini。谷歌DeepMind首席执行官、Gemini团队代表德米斯·哈萨比斯(Demis Hassabis)表示,谷歌运行了32个完善的多模态基准测试来比较Gemini和OpenAI的GPT-4,Gemini“在32项基准测试的30项中大幅领先”。MMLU(大规模多任务语言理解)是测试AI模型知识和问题解决能力的最流行方法之一,而Gemini首次在MMLU的得分率达到90.0%,是第一个在MMLU测试中超过人类专家的模型。Gemini包括一套三种不同规模的模型:Gemini Ultra是最大、功能最强大的类别,被定位为GPT-4的竞争对手;Gemini Pro是一款中端型号,性能优于GPT-3.5,可扩展多种任务;Gemini Nano用于特定任务和移动设备。除了文字之外,Gemini还可以理解多种形式的输入和输出,包括文字、代码、音频、图片和视频。Gemini能很好地理解具有细微差别的信息,回答与复杂主题相关的问题,这就使其尤其擅长解释数学和物理等复杂科目中的推理。谷歌还发布了一个时长六分钟的视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言描述、让Gemini利用一张地图设计智力问答、和Gemini玩杯子游戏和推理小游戏等等。在整个过程中,Gemini的反应速度都非常快,还会生成音频和图片来辅助回答,并可以用上一些口语化乃至幽默化的表达。我们认为,当前大模型应用仍处于技术不断迭代的快速成长初期阶段。未来,各类大模型将具备更强的多模态能力,有效解决不同场景下细分领域、更加复杂的应用,赋能千行百业提质增效。AI大模型多模态应用有加速落地趋势。
AI视频软件“Pika”表现惊艳,文生视频类应用或催化传媒、游戏类行业创作生产及运营效率提升
稍早,初创企业Pika Labs宣布推出旗下首个AI视频软件Pika1.0,迅速在各大社交媒体上走红。根据相关资料,pika1.0包括新的人工智能模型,能够通过一句简洁的文字或是一张图片生成视频,还可以简单易用地生成和编辑各种风格的视频,如3D动画、动漫、卡通和电影。也可以通过简单的指令实现画布延展、局部修改、视频时长拓展等编辑。Pika社区已经发展到50万用户,每周生成数百万个视频。目前,成立于2023年4月、仅有四名成员的Pika Labs已经完成三轮合计5500万美元的融资,最新估值为2.5亿美元。此外,Runway最近推出了Runway Gen-2生成式AI模型新版本,能够生成图像、视频和带文本的视频。其“运动画笔”(Motion Brush)功能,可以让图片变成视频,迅速动起来。A股创业板企业万兴科技(300624),在公众号上线AI创作的短视频《女孩的一生》,展现了国内多媒体大模型的视频生成能力。AI类视频应用,还有Meta的Emu Video,以及字节跳动的Pixels Dance等等。我们认为,文生视频类AI大模型应用或催化传媒、游戏类行业创作生产及运营效率提升。准确把握产业发展趋势、拥有前瞻性技术布局的相关企业,可能较快取得市场先发优势。
GPTs助力“普惠”AIGC,AI生态建设重要性凸显
OpenAI首次开发者大会推出的简易定制GPT工具(GPTs)引发开发热潮,一周时间GPTs的数量就达到1.5万个。由于使用量过大,11月15日阿尔特曼宣布暂停ChatGPT Plus新用户注册。该功能是ChatGPT的付费版,月费20美元,付费开通才能开发定制GPTs和使用其他人开发的GPTs。自定义GPTs是OpenAI在开发者大会上推出的一项重磅功能,用户无需任何代码,全程支持可视化点击操作。只需要给ChatGPT对话指令、额外的知识数据,然后选择是否需要网络搜索、数据分析和图片生成等多模态功能,就能构建法律、写作、营销等特定领域的ChatGPT助手,发布到GPT Store,可赚取分成收益。百度创始人、董事长兼首席执行官李彦宏表示:“技术创新的最终目的是应用,人类进入AI时代的标志是出现大量的AI原生应用,而不是出现大量的大模型”。我们认为,数据、算法、算力、应用导向、工程化能力等均是AI落地开花,以及进一步普惠化应用的必要条件。而构建起创新开放、弹性包容、全链贯通、功能完备的产业生态,更是保障产业长期健康、稳健发展的充分且必要条件。
投资建议:我们认为,大模型多模态应用有加速落地趋势,或催化千行百业数智化、普惠化创新发展。建议关注:1、基础算力:软通动力(拟收购同方计算机)、神州数码、中科曙光、浪潮信息;2、大模型:中科创达、科大讯飞;3、视频、游戏应用:万兴科技、昆仑万维、盛天网络、当虹科技;4、AI硬件终端:大华股份、漫步者、萤石网络;5、文本办公:福昕软件、金山办公。
风险提示:需求释放不及预期;竞争加剧;技术进展不及预期。





微信
扫描二维码
关注
证券之星微信
APP下载
好投资评级:
好价格评级:
证券之星估值分析提示神州数码盈利能力一般,未来营收成长性良好。综合基本面各维度看,股价合理。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-