(原标题:国泰君安:豆包实时语音大模型上线 AI软硬件场景落地受益)
智通财经APP获悉,国泰君安发布研报称,豆包实时语音大模型上线,该模型一举实现理解情绪、联网、控制语气语调、随时打断等效果。增加了情感的语音交互将显著有利于AI的软硬件应用,能够降低使用门槛、改进效率、提升体验,对于AI软硬件场景落地都将是显著帮助。
事件:1月20日,豆包实时语音大模型正式推出,并在豆包APP全量开放。
国泰君安主要观点如下:
该模型可理解输入语言情绪、实时联网,在输出时具备强大声音控制能力,且高度近似人类、有超低延迟、可随时打断
其真人级语音对话能力具体表现在以下方面:1)拟人化的情感承接,能够理解用户的内容及情绪,并用恰当的语气做出回应;2)强大的声音控制和丰富的情感演绎能力,能够遵循丰富的复杂指令,配合不同的音色、情绪及状态输出,可以讲故事、讲方言和口音、甚至唱歌;3)智商与表现力之间的平衡,该模型的表现力高度接近真人,包括类人的语气词、停顿思考等,模型也有实时联网功能,使其能够根据问题,动态获取最新信息,对时效问题给到精准、及时的回应;4)丝滑的交互体验和超低延迟,实现在更低系统时延情况下的生成准确性、自然度,并且具有敏锐的语音打断与用户对话判停能力。
豆包实时语音大模型的整体满意度较GPT-4o有明显优势,特别是在语音语气自然度和情绪饱满度方面远高于后者
豆包团队围绕拟人度、有用性、情商、通话稳定性、对话流畅度等多个维度选取数十名外部测试者进行考评,豆包实时语音大模型整体满意度(以5分为满分)得分为4.36,GPT-4o为3.18,超过半数的测试者对豆包模型表现打出满分,且豆包模型在情绪理解和情感表达方面优势明显,尤其在“一听就是AI与否”的评测中被认为AI的概率极低。
增加了情感的语音交互将显著有利于AI的软硬件应用,能够降低使用门槛、改进效率、提升体验,包括如下应用场景:
1)情感陪伴与智慧教育应用,推荐恺英网络(002517.SZ),受益标的盛天网络(300494.SZ)、南方传媒(601900.SH)、世纪天鸿(300654.SZ)、昆仑万维(300418.SZ);
2)AI陪伴硬件如AI玩具、AI宠物,可帮助硬件生产商与IP方扩大需求,推荐上海电影(601595.SH),受益标的汤姆猫(300459.SZ);
3)AI眼镜、AI耳机、AI音箱等生活效率产品将受益于交互方式的改进,受益标的小米集团-W(01810)。
风险提示:AI应用落地进度不及预期,商业化进展不及预期,相关公司主营业务业绩压力。