近日OpenAI发布了诞生于GPT-3基础上的聊天机器人ChatGPT,短短几天引爆网络,用户数突破100万。ChatGPT根据强化学习的奖励模型调整迭代为用户生成建议,应用场景丰富,可以参加考试、写诗、修bug,“智商”很高。当前人形机器人优先“四肢发达”,未来“头脑发达”为其终极追求。人机交互领域智能体虽依然存在无法完全根据现实生活进行自主推演,具有道德约束风险等缺陷,但其在语义交互上的进步显著。随着人机交互技术在语音、语义、肢体等交互能力的成熟,人形机器人灵活适用于更广阔的ToC场景指日可待。
ChatGPT根据强化学习奖励模型与用户进行语义交互,应用场景丰富OpenAI发布了诞生于GPT-3基础上的聊天机器人ChatGPT,具备用户友好的对话交互界面,根据指令提供详细响应。首先,由人类标记员对于用户提交的prompt来编写答案,把这些答案的数据集收集起来,通过监督学习对GPT进行微调。然后,由人类标记员对于模型产出的答案进行排序,以此收集比较数据用于训练强化学习的奖励模型,以捕捉人类偏好。最后,采用PPO(近端策略优化)算法对模型进行微调迭代,帮助AI优化回复内容。ChatGPT应用场景丰富,可以参加考试、写诗、修bug,“智商”很高。但同时,ChatGPT也存在局限性。有时会生成包含虚假和明显错误的回复;虽具合法和道德约束设置,但仍有破解方法。
人机交互模块的突破增强人形机器人ToC商业化应用确定性人机交互系统为人形机器人的“大脑”。人形机器人主要包含三大核心技术模块:环境感知模块、运动控制模块和人机交互模块。三大核心模块技术进展差异显著,人机交互仍存挑战。语音语义分析作为人机交互核心途径,帮助机器人具备听、说、理解和思考的能力。当前人形机器人积极发展运动性能,通过“指令执行”工作模式解决劳动力短缺问题,但人机交互的挑战限制其商业应用场景。
当前人机交互领域捷报频传,AI越来越能够适应不确定性的真实世界并理解演绎角色。人机交互领域智能体虽然存在无法完全根据现实生活进行自主推演,具有道德约束风险等缺陷,但其在语义交互上的进步显著。随着人机交互技术在语音、语义、肢体等交互能力的成熟,人形机器人灵活适用于更广阔的ToC场景指日可待。
GPT模型历经四代发展,模型简化满足细分任务应用GPT模型自发布以来历经四代,其中GPT3模型参数量达到1750亿,奠定了AI进入大模型时代。ChatGPT仅有约13亿参数,但细分任务领域表现依旧出色,我们认为基于大模型提炼小模型实现各类任务模块有望成为AI商业化的有效路径,能够有效解决AI模型训练成本过高的问题。
相关投资标的1)AI模型:浪潮信息(“源1.0”AI大模型)2)大数据存储:星环科技(分布式数据库)3)AI自然语言处理厂商:拓尔思(语义智能)、科大讯飞(智能语音交互)风险提示AI技术迭代不达预期;人机交互技术迁移不达预期;人形机器人商业化进程不达预期。