(原标题:永信至诚AI测评“数字风洞”上线应用与数据安全“DNA验证”功能)
6月24日,永信至诚(688244)发布AI大模型领域全新研究成果,旗下的AI测评「数字风洞」平台上线应用与数据安全“DNA验证”模块。
该平台凭借智能永信团队提出的基于生成数据提取应激反馈特征的“DNA验证”创新测试方法,实现了针对不同大模型之间的“同源性”验证,能够有效助力开发团队保护和验证自身大模型的技术原创性与知识产权合规性,帮助开发团队、建设和监管单位快速发现安全隐患,助力大模型安全建设、监管与风险处置。
6月初,美国斯坦福大学一AI团队在未取得授权的情况下,对国内AI创业公司面壁智能研发的开源大模型MiniCPM 进行了“套壳”,但在质疑声中该团队拒绝承认。随后,面壁智能MiniCPM研究团队将具备原创性的“清华简”图片,交由斯坦福的Llama3-V大模型进行图片识别,最终二者识别结果完全无二,证明了Llama3-V大模型存在抄袭。
基于“DNA验证”模块,「数字风洞」平台针对案例中引起热议的两个大模型进行了对比试验。通过对斯坦福Llama3-V“套壳”案例的复现,证实了斯坦福团队在基座构建和训练数据集上与中国大模型存在着高度相似性。
通过对生成应激数据的观测比对,AI测评“数字风洞”平台能够提取开源基座大模型的“应激反馈特征”,形成测试载荷对大模型展开安全检测,验证不同大模型之间是否存在同源性,通过识别大模型之间的数据关联关系,来发现从亲缘关系中继承来的安全风险。这一创新研究,填补了当前大模型产业内在大模型相似性、亲缘性关系验证能力方面的空白。
永信至诚表示,接下来将基于对各大开源基座大模型的测评数据,以及全新上线的应用与数据安全“DNA验证”模块,识别不同开源大模型的“应激反馈特征”,积累沉淀出开源大模型“过敏源特征库”,将所有异常敏感数据打造为测试载荷,更高效的实现对业界大模型产品安全策略的检测。
利用观测数据绘制大模型领域的“血缘关系”图谱,帮助各大AI创业团队、建设和监管单位,评估模型的稳健性和安全性,共同推动AI大模型生态的健康发展。(燕云)
校对:陶谦