首页 - 股票 - 研报 - 行业研究 - 正文

大模型进程焦点:OpenAI春季发布会及谷歌开发者大会要点归纳

来源:信达证券 作者:冯翠婷 2024-05-16 15:32:00
关注证券之星官方微博:
(以下内容从信达证券《大模型进程焦点:OpenAI春季发布会及谷歌开发者大会要点归纳》研报附件原文摘录)
事件:北京时间5月14日凌晨,OpenAI发布了最新模型GPT-4o,GPT-4o(“o”代表“omni”)接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。它可以在短至232毫秒的时间内响应音频输入,平均为320毫秒,与人类的响应时间相似。它在英语文本和代码上的性能与GPT-4Turbo的性能相匹配,在非英语文本上的性能显著提高。与现有模型相比,GPT-4o在视觉和音频理解方面尤其出色。
GPT-4o的文本和图像功能5月14日已经开始在ChatGPT中推出。OpenAI正在免费套餐中提供GPT-4o,并向Plus用户提供高达5倍的消息限制,未来几周将在ChatGPTPlus中推出新版语音模式GPT-4o的alpha版。开发人员现在还可以在API中访问GPT-4o作为文本和视觉模型。与GPT-4Turbo相比,GPT-4o速度提高2倍,价格降低一半,速率限制提高5倍。OpenAI计划在未来几周内在API中向一小部分值得信赖的合作伙伴推出对GPT-4o新音频和视频功能的支持。
在OpenAI发布会上,团队展示了GPT-4o的多个功能。包括实时语音交流能力,几乎无延迟,达到真人聊天的水平;可以识别用户的语音情绪,语音有情感;可以使用不同语言(英语、意大利语)和多人同时交互;在语音的同时可以与视频实时交互;实时交流,协助阅读代码,指导编程;实时视频聊天,并识别情绪等。
北京时间5月15日凌晨,GoogleI/O开发者大会正式开幕。公司更新了Gemini1.5Pro,引入了1.5Flash较小型号的Gemini版本,同时也增加了两个新的Gemma模型。Gemini1.5Pro:普通版本配备了100万token上下文窗口,而Gemini1.5Pro将在GoogleAIStudio或适用于GoogleCloud客户的VertexAI中的候补名单中拥有200万个代币上下文窗口。在智能代理领域,谷歌展示了其最新的人工智能代理GoogleAstra项目,可与用户实现多模态交互。
多模态领域,谷歌推出全新视频生成模型Veo,可生成各种电影和视觉风格的高质量1080p分辨率视频,时间可以超过一分钟;升级了文生图新模型Imagen3,对图像细节的把控度更高;发布了人工智能音乐生成模型Lyria。以及在AI搜索功能、照片问询功能均实现了一定程度的升级迭代。





微信
扫描二维码
关注
证券之星微信
APP下载
相关股票:
好投资评级:
好价格评级:
证券之星估值分析提示信达证券盈利能力良好,未来营收成长性优秀。综合基本面各维度看,股价偏高。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-