(原标题:永信至诚:AI大模型急需常态化测试评估,“数字风洞”保障AI数字健康)
3月13日,永信至诚(688244)董事副总经理、智能永信总经理张凯受邀出席华创证券“算力赋能,应用无限”论坛,并在会上发表《AI大模型安全测评数字风洞》主题演讲,提出AI大模型急需常态化测试评估,永信至诚“数字风洞”产品体系双管齐下,全面支撑AI大模型基础设施安全与内容风险测评,为AI数字健康提供强有力保障。
随着AI技术的发展和广泛应用,特别是AI大模型的兴起,推动着社会生产力的不断创新与变革,也带来了前所未有的安全风险和挑战。张凯提出,“百模大战”时代下,一些实际存在的AI大模型安全问题引发公众的深切担忧,一是AI大模型作为复杂的软件系统,面临基础设施和软件安全风险,如系统漏洞、数据泄露、模型篡改等;二是AI大模型虽然提高了内容产出质量,但同时生成的内容可能包含误导信息或偏见内容,被用于不良目的,如钓鱼邮件和恶意软件的编写,降低网络攻击等犯罪门槛。
针对AI大模型存在的安全问题以及大众的担忧,结合监管要求,张凯认为要从实质安全运营的角度出发,基于AI大模型安全测评“数字风洞”,对基础设施安全和内容安全风险进行持续性检查。
首先,AI大模型安全测评“数字风洞”作为一个以安全检测为核心,以“产品乘服务”体系为手段,以安全风险防范化解为目标的测试评估平台,通过模拟各种网络攻击和系统入侵场景,检验AI大模型在不同攻击下的韧性,识别AI大模型基础设施存在的风险,预见和预防未来可能出现的威胁。张凯表示,同时基于永信至诚自主研发的风洞时光机系统,构建“测试-发现风险-迭代优化-再测试-再迭代优化”的科学测评流程,通过安全风险的反复验证、消除和收敛,提升实质性安全。
其次,针对内容安全风险,张凯强调AI大模型安全测评“数字风洞”的核心优势在于集成了永信至诚AI春秋大模型和“数字风洞”产品体系的能力。基于100+提示词检测模板以及20万+基础提问,AI大模型安全测评「数字风洞」以攻击者视角构建出引导AI大模型产生不当回答的测试载荷,对AI大模型的安全规则和过滤机制进行深入测试,评估其在处理潜在敏感、违法或不合规内容时的反应,确保AI大模型输出内容更符合社会伦理和法律法规要求,避免安全隐患变成安全事件。
对于AI大模型安全测评“数字风洞”的应用价值,张凯认为可以在多方面体现,例如,监管机构可以通过“数字风洞”对市场上已公开使用的AI大模型以及将要上市的AI大模型进行安全测评,为安全合规工作提供智能化手段支持;AI大模型厂商或AI大模型安全公司可以利用AI大模型安全测评“数字风洞”充分识别自身模型的弱点和安全内容漏洞,进一步强化产品本身的过滤系统和内容辨别能力。
2022年,我国人工智能核心产业规模已达5000亿元。据沙利文咨询预测,2024年我国人工智能市场规模将突破7993亿元。这也意味着,随着AI技术的广泛应用,AI大模型安全测试评估赛道拥有巨大的市场潜力和发展空间。张凯认为,AI发展的大体历程可以分为三个阶段:AI助手、AI工具以及AI智能体。在AI智能体阶段,“数字风洞”作为AI大模型的安全基座,持续支撑AI大模型常态化安全测试评估,为AI技术在千行百业的安全应用保驾护航,保障AI“数字健康”,带给世界安全感。(燕云)
校对:刘榕枝