(原标题:中银证券:Figure“单飞” 端到端具身智能未来可期)
智通财经APP获悉,中银证券发布研报称,端到端模型高度集成化的控制策略、多模态感知能力和强化学习能力有望优化具身智能的表现,加快具身智能的响应速度、缩小认知差距。人形机器人作为具身智能的表现形式之一,2025年有望成为人形机器人的量产元年,建议关注相关产业链公司。
事件:2月4日,Figure机器人创始人Brett Adcock宣布终止与OpenAI的合作关系,并表示Figure在完全自主研发的、完全端到端机器人AI方面取得重大突破,将在未来30天内向外界展示。
中银证券主要观点如下:
端到端模型是解决具身智能问题的“良方”
Figure创始人Adcock在接受Techcrunch采访时表示,要在现实世界中解决具身智能问题,就必须垂直整合机器人AI模型,而不能依靠外包;正确的解决方案是建立一个为特定硬件专用的端到端AI模型。端到端模型是具身智能的主流技术方案之一。
与分层决策模型相比,端到端模型能够减少中间环节,实现感知、规划与执行一体化,提高效率和响应速度;但端到端模型往往需要海量的训练数据,会消耗大量资源,存在黑箱效应。
模型的训练数据包括真实数据和仿真数据,前者训练效果好,但需要耗费大量人工和硬件成本;后者成本较低,可以大规模获取,但通常存在sim-to-real gap。
人形机器人训练速度有望加快
1月7日-10日,CES在美国拉斯维加斯举行英伟达CEO黄仁勋在会上发布了用于合成运动生成的NVIDIA Isaac GR00TBlueprint、“世界基础模型”NVIDIA Cosmos,帮助开发者生成海量合成运动数据集;Cosmos平台还能够将图像从3D扩展到真实场景,以缩小仿真与现实之间的差距。
此外,英伟达Omniverse平台能够为机器人创造一个遵循物理规律的、现实世界的数字孪生环境,为机器人创造大量的学习场景;同时,开发者可以在Omniverse上建立多元宇宙,使机器人以不同的方式并行学习,从而大大缩短训练时间。
DeepSeek有望缩小机器人认知差距,加快响应速度
1月20日,DeepSeek发布复杂推理模型DeepSeek-R1并同步开源权重。该模型在后训练阶段大规模使用强化学习技术,模型推理能力明显提升,性能比肩2024年12月发布的OpenAI o1正式版,但训练成本及API服务成本和服务价格大幅下降。
此外,DeepSeek还发布了开源多模态AI模型Janus-Pro,进一步提升了模型的多模态理解和文本到图像的指令跟踪能力。DeepSeek大模型推理能力和多模态能力的提升有望弥合机器人“看到”和“理解”之间的差距,加快机器人决策和响应的速度。
2025年有望成为人形机器人量产“元年”
1月30日,特斯拉CEO埃隆·马斯克表示2025年Optimus机器人产能将扩至每月1000台,2026年扩至每月10000台,2027年扩至每月10万台。国内的智元机器人、宇树科技、优必选等人形机器人厂家在2025年也均有量产计划。2025年有望成为人形机器人的量产“元年”,相关产业链公司有望受益。
机器人领域有布局的行业公司包括软通动力、九号公司、优必选、能科科技、麒麟信安等;大模型领域有布局的行业公司包括商汤科技、科大讯飞、拓尔思、云赛智联、虹软科技等机器人数据训练领域有布局的公司包括中科曙光、索辰科技等。
风险提示:
技术发展进程不及预期,行业竞争加剧,人形机器人商业化落地进程不及预期。