国泰海通:GPT-5.2系列重新定义AI生产力 驱动AI从模型竞争转向场景落地

来源:智通财经 2025-12-18 15:37:04
关注证券之星官方微博:

(原标题:国泰海通:GPT-5.2系列重新定义AI生产力 驱动AI从模型竞争转向场景落地)

智通财经APP获悉,国泰海通发布研报称,GPT-5.2系列的发布,标志着大模型能力从技术演示迈入规模化经济生产的新阶段。其在抽象推理与复杂知识工作上达到人类专家水准,证实了AI在高端专业领域创造经济价值的潜力。这将推动产业竞争焦点加速从底层模型向具体的场景应用、企业服务及人机协同工作流等落地环节转移。

国泰海通主要观点如下:

GPT-5.2在核心推理与专业工作任务上实现历史性跨越,首次在综合评估中达到人类专家水平

12月12日,OpenAI于十周年之际正式发布GPT-5.2系列模型,该系列包含Instant、Thinking与Pro三个版本,旨在应对不同复杂度的任务需求。在被誉为“AI界图灵测试”的ARC-AGI-2测试中,其获得52.9%的分数,较GPT-5.1的17.6%提升近三倍,抽象推理能力追平近期发布的Gemini 3。更具突破性意义的是其在GDPval基准测试中的表现,该测试覆盖44个真实职业场景,GPT-5.2 Thinking在70.9%的任务上胜过或打平行业专家,GPT-5.2 Pro更是达到74.1%,这是AI模型首次在综合性知识工作评估中整体达到人类顶尖水平。在投行财务建模等专业任务中,其平均得分从59.1%提升至68.4%,标志着AI开始深度渗透核心生产力环节。

GPT-5.2的代码生成、长上下文与视觉理解能力同步取得显著进步,为复杂多模态任务提供可靠支持

在更接近真实工程环境的SWEBench Pro评测中,GPT-5.2 Thinking取得55.6%的SOTA成绩,并在前端与3D界面生成上展现出更强潜力。其长上下文处理能力实现质的飞跃,在256K token长度的“多针检索”测试中准确率接近100%,而GPT-5.1仅为30%,使其能够深度分析超长文档与复杂项目。视觉方面,其在科学图表问答(CharXiv Reasoning)与GUI界面理解(ScreenSpot-Pro)的错误率较前代降低近半,空间定位能力显著增强,为AI代理处理真实世界信息夯实了基础。

GPT-5.2的工具调用可靠性大幅提升,面向企业级应用优化安全与部署策略

GPT-5.2在多轮复杂工具调用测试(Tau2-bench)中取得98.7%的高分,能自主规划并完成涉及改签、赔偿等多步骤的客服流程,展现了强大的端到端任务执行能力。与此同时,OpenAI延续了其迭代部署策略,在ChatGPT中为付费用户提供GPT-5.2系列(Instant, Thinking, Pro),并保留GPT-5.1长达三个月以保障平稳过渡。API虽提价约40%,但官方强调其token效率的提升可使总成本可控,持续测试中的年龄预测与内容保护机制也体现了对安全性的持续投入。

风险提示:大模型迭代速度不及预期,算力供给不足,数据隐私合规风险。

微信
扫描二维码
关注
证券之星微信
APP下载
广告
相关股票:
好投资评级:
好价格评级:
证券之星估值分析提示国泰海通行业内竞争力的护城河较差,盈利能力一般,营收成长性良好,综合基本面各维度看,股价合理。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-