(以下内容从国金证券《计算机行业研究:国产AI产品持续出新,OpenAI揭示模型幻觉原因》研报附件原文摘录)
本周观点
月之暗面团队近日发布Kimi K2模型系列的0905版本,模型更新后在真实编程任务的多方面表现均有提升。
Kimi K2模型最初于7月11日首次发布,采用混合专家架构,总参数10000亿,激活参数320亿。根据官方公告,Kimi K20905版本在真实编程任务中有多方面改进,其Agentic Coding能力在公开基准测试和真实编程任务中表现更好,前端编程体验升级,代码美观度和实用性增强。快手近期推出并开始内测一款名为Kwali的AIGC工具,定位为“AI超级员工”。该工具通过其云端的多智能体协作框架,实现一句话生成完整短视频的功能,覆盖从创意解析、脚本撰写、素材匹配到剪辑发布的全部流程。据悉,Kwali整合了快手自有的干寻素材库和数字人模特库,能够自动调用经过市场验证的热门镜头和脚本模板,并支持用户上传私有素材进行无缝混剪。字节跳动近期开始内测其最新的图像创作模型Seedream4.0,并计划很快在旗下产品豆包、即梦等平台全面上线。该模型的最大特点是支持多模态创作,单一模型即可处理文本、单张或多张图像的组合输入,实现从生成到编辑的一站式流程。新模型增强了主体特征的一致性,支持灵活的多图输入与输出(如角色融合、生成分镜),并能以数秒速度直接生成高达4K分辨率的图像。OpenAI近日发布论文,系统性揭示了大语言模型产生“幻觉”的原因。文章指出,幻觉的核心根源在于现有训练与评估机制奖励猜测、惩罚诚实,导致模型更倾向于自信地编造,而不是承认“不知道”。该工作将Al的幻觉定义为模型自信地生成不真实答案的情况,导致这种现象的原因在于,标准的训练和评估程序更倾向于对猜测进行奖励,而不是在模型勇于承认不确定时给予奖励。字节跳动Seed团队近日发布技术报告,提出了统视觉语言模型Robix,可整合推理、任务规划和自然语言交互三项机器人高级认知层面的核心能力,用于取代传统的管道化机器人系统。Robix的设计思路在于利用CoT,将交互式任务执行构建成一个统一的“推理-行动”序列,研究者为此设计了一套包含三个阶段的训练策略。经测试,Robix在基础感知和推理、离线交互和在线评估等任务中均实现SOTA。
中报期结束,总体看,二季度经营强度表观有所回落,但总体处于回暖改善通道中,利润端强度高于收入端,龙头企业经营韧性强于行业总体表现;结构看,AI产业链上游、军工信息化、智能驾驶等方向经营表现更强;展望下半年,在低基数和新技术落地加快背景下,预计下半年总体经营强度会好于上半年。大的主线预计还是集中在AI产业链相关方向,AI落地在上半年有相比前两年更多的进展,下半年预计环比上半年有进一步的倍数增长;随着10月进入三季报披露期,投资者对财报关注度又会逐步提升,我们认为计算机板块处于主业回暖改善,AI应用落地加速的周期,基本面强度和市值波动贡献度提升,但从行业比较的角度,总体业绩强度应该弱于AI上游相关度高、业绩兑现强度大的电子半导体、通信的相关环节,因此估值波动还是板块波动的相对主要影响因素。我们认为确定性相对高的AI落地方向,一是软硬结合的端侧AI硬件,二是C端尤其是出海方向软件,三是B端企业服务和制造业信息化相关领域,四是G端/大B端的大模型定性化、私有化部署/一体机等。细分行业景气度看,25年我们认为高景气维持的赛道包括AI算力、激光雷达;加速向上的赛道有AI应用;稳健向上的赛道包括软件外包、金融IT、量子计算、数据要素、EDA、出海、信创;拐点向上的赛道包括教育IT、网安、企业服务;底部企稳的赛道包括智慧交通、政务IT、安防、建筑地产IT;略有承压的赛道包括工业软件、医疗IT。
投资建议
建议关注国内生成式大模型龙头科大讯飞;AI硬件有望成为应用落地的新载体,建议关注海康威视、虹软科技、禾赛等;AI相关功能打磨能够带动付费率、Arpu值提升,建议关注迈富时等。
风险提示
行业竞争加剧的风险;技术研发进度不及预期的风险;特定行业下游资本开支周期性波动的风险。
