首页 - 股票 - 研报 - 行业研究 - 正文

传媒行业AIGC专题一:探析AIGC的技术发展和应用

来源:德邦证券 作者:马笑 2023-02-13 00:00:00
关注证券之星官方微博:

AIGC 成为新的内容生产方式,跨模态生成值得重点关注。区别于 PGC 与 UGC,AIGC 是利用人工智能技术自动生成内容的新型生产方式。按照模态区分,AIGC可分为音频生成、文本生成、图像生成、视频生成及图像、视频、文本间的跨模态生成,细分场景众多,其中,跨模态生成需要重点关注。

自然语言处理(NLP)赋予了 AI 理解和生成能力,大规模预训练模型是 NLP 的发展趋势。NLP 的两个核心任务分别是自然语言理解(NLU)和自然语言生成(NLG)。

以 ELMo、BERT、GPT 为代表的预训练模型,降低了 NLP 的技术门槛。ELMo 解决了“一词多义”的问题;BERT 通过 MLM(类似于完形填空)和 NLP(判断句子是否相连)进行预训练,增强了上下文的理解能力。GPT 通过预测下一个词,获得了生成能力;GPT-3在此基础上使用了更大的数据和更大模型,无需针对下游任务进行传统的微调,并且采用了小样本学习提升生成效果。

ChatGPT 是 NLP 发展中具有里程碑式意义的模型之一。ChatGPT 是 OpenAI 从GPT-3.5系列中的模型进行微调产生的聊天机器人模型。它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。

生成模型赋予了 AI 创造力,扩散模型是最前沿的技术之一。AIGC 的快速发展归功于生成算法领域的技术积累。GAN 的核心思想是“生成”与“对抗”,相比传统的深度神经网络,GAN 能产生更好的生成样本,但是仍需解决应用中的问题。扩散模型较 GAN 更接近人的思维模式,是基于马尔科夫链,通过学习噪声来生成数据。扩散模型实现了跨模态应用,包括 OpenAI 的 GLIDE 和 DALL·E 2、谷歌的Imagen、Stability AI 的 Stable Diffusion 等。

人工智能由单模态智能,向多种模态融合方向发展。建立统一的、跨场景、多任务的多模态基础模型或将成为人工智能发展的主流趋势之一。CLIP 模型将语言信息和图像信息联合训练,能够链接文本和图片,成为跨模态生成应用的一个重要节点,“CLIP+其他模型”在跨模态生成领域成为一种较为通用的做法。2022年,微软提出的 BEiT-3多模态基础模型,在视觉-语言任务处理上具备出色表现,包括视觉问答、图片描述生成和跨模态检索等。多模态提高了基础模型的灵活性,使其在其他模态的应用中发挥新的潜质。

未来,值得关注的技术要素包括:长文本生成、开放式文本生成、NeRF 模型、扩散模型、跨模态大型预训练模型(支持的模态数据类型、模态对齐架构设计、支持的下游应用)、小样本学习及自监督算法、强化学习及环境学习等。

投资建议:把握 AIGC 技术催化和商业落地的投资机会。技术发展有望促进生产效率提升,并进一步创造新的消费和需求,有利于文娱内容和互联网行业。在 AIGC和 ChatGPT 方面,我们建议持续关注技术发展和应用情况,把握技术催化和商业化落地带来的投资机会:1)具备 AIGC 和 ChatGPT 的技术探索和应用的公司:

百度集团-SW、商汤-W、万兴科技、拓尔思等;2)具有海量内容素材且具有 AIGC探索布局的,图片/文字/音乐/视频内容及平台公司腾讯控股,阅文集团、美图公司、视觉中国、中文在线、汉仪股份、昆仑万维、天娱数科、风语筑等。

风险提示:技术发展不及预期、监管政策变化、知识产权相关问题等。





相关附件

微信
扫描二维码
关注
证券之星微信
APP下载
好投资评级:
好价格评级:
证券之星估值分析提示视觉中国盈利能力一般,未来营收成长性较差。综合基本面各维度看,股价偏高。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-