(原标题:新开普:数据是通过公司内部测试得出的真实数据)
同花顺(300033)金融研究中心03月18日讯,有投资者向新开普(300248)提问, 请问公司向媒体表示自研的星普大模型,通过SFT RL(监督微调 强化学习)的训练技术,在内部测评验证中,实现了与DeepSeek-R1相近的智能推理效果,而算力消耗仅约为其1/20,这数据是真实的吗?
公司回答表示,您好,感谢您的关注!数据是通过公司内部测试得出的真实数据。目前公司训练模型的主要目的是赋能校园服务与管理场景下的智能助手,不聚焦通用场景。文中实验主要是围绕着智能助手在校园答疑、信息化服务、数据洞察等具体应用场景下的特定使用方式进行的,训练语料数量和种类小于通用模型所需,模型使用方式和通用场景之间也不直接具备可比性。公司在小参数量模型上所复现的长思维链生成能力是一个成功的初步探索,表明小模型也可以生成具有逻辑连贯性的长思维链,这为小模型在校园场景落地打下了很好的基础。当前公司所复现的长思维链小模型在通用性、逻辑深度、以及鲁棒性等方面,当然与满血版 DeepSeek-R1 的表现存在差距。此外,算力消耗是指推理阶段的算力消耗,不是指训练阶段的算力消耗。请广大投资者注意投资风险。谢谢!
点击进入交易所官方互动平台查看更多