开源证券:OpenAI o1模型来临 RL助力模型提升推理能力

来源:智通财经 2024-09-13 16:53:06
关注证券之星官方微博:

(原标题:开源证券:OpenAI o1模型来临 RL助力模型提升推理能力)

智通财经APP获悉,开源证券发布研报称,早期AI大语言模型性能提升主要凭借Scaling law,在语料数据集以及模型参数持续提升的情况下,模型的性能持续突破,而新一代o1系列模型问世,代表着模型能通过RL在除开训练侧之外的推理侧,引入思维链等新技术的方式提升模型的性能,为科学、数学、编码等专业领域提供更准确的答案,或是生成式AI发展的重要拐点。此外,OpenAI表示除了新的OpenAI o1系列之外,仍在继续开发GPT系列模型。

OpenAI发布o1-preview和o1-mini模型,推理能力显著提升

北京时间2024年9月13日,OpenAI发布新一代o系列模型o1以及o1-mini,在模型训练时引入大规模reinforcement learning(RL),随着训练时计算(train-timecompute)时间的增加以及推理(test-time compute)时间的延长,o1模型性能持续提升。

通过RL训练,o1模型在推理时使用思维链(Chain of Thought)的方式解决问题,能够将复杂问题分解成多个简单步骤,并即时识别和纠正错误,显著提升了模型的推理能力。在最大化推理时间的前提下,o1在绝大多数推理密集型任务中性能显著优于GPT-4o,模型测试结果显示,57个MMLU 子类别中,o1在54个子类别中的表现优于GPT-4o,性能可与人类专家媲美。

o1模型尚未单独定价,计划为chatgpt免费用户提供o1-mini使用权限

从推理成本上看,o1模型主要在大型文本数据集上预训练,推理成本较高且速度较慢,o1-mini模型在预训练阶段争对STEM推理进行优化,尤其擅长数学及代码领域,模型参数较小且延时推理较低,推理成本比OpenAI o1-preview低80%。

目前,ChatGPT Plus和 Team用户将能够访问 ChatGPT中的o1系列模型,Enterprise和Edu用户将在下周开启访问,OpenAI当前仅在ChatGPT和API中提供模型预览版本,未来将上线浏览、文件和图像上传以及其他功能,未来将为ChatGPTFree用户提供o1-mini使用权限。o1模型并未额外定价,但使用存在限制,o1-preview模型的每周使用限制为30条消息,o1-mini的每周使用限制为50条消息。

AI大模型持续迭代,国内外云巨头持续增加对AI基础设施的资本开支,持续看好算力产业链

推荐标的:宝信软件(600845.SH)、中际旭创(300308.SZ)、英维克(002837.SZ)、新易盛(300502.SZ)、天孚通信(300394.SZ)、中兴通讯(000063.SZ)、盛科通信(688702.SH)。

受益标的:润泽科技(300442.SZ)、源杰科技(688498.SH)、华工科技(000988.SZ)、紫光股份(000938.SZ)、光迅科技(002281.SZ)、华丰科技(688629.SH)、网宿科技(300017.SZ)、烽火通信(600498.SH)、云赛智联(600602.SH)等。

风险提示:AI发展不及预期、智算中心建设不及预期、行业竞争加剧。

fund

微信
扫描二维码
关注
证券之星微信
APP下载
好投资评级:
好价格评级:
证券之星估值分析提示中兴通讯盈利能力一般,未来营收成长性优秀。综合基本面各维度看,股价偏低。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-