永信至诚：AI大模型急需常态化测试评估，“数字风洞”保障AI数字健康

才艺展示 2024年03月15日 63790

3月13日，永信至诚(688244)董事副总经理、智能永信总经理张凯受邀出席华创证券“算力赋能，应用无限”论坛，并在会上发表《AI大模型安全测评数字风洞》主题演讲，提出AI大模型急需常态化测试评估，永信至诚“数字风洞”产品体系双管齐下，全面支撑AI大模型基础设施安全与内容风险测评，为AI数字健康提供强有力保障。

随着AI技术的发展和广泛应用，特别是AI大模型的兴起，推动着社会生产力的不断创新与变革，也带来了前所未有的安全风险和挑战。张凯提出，“百模大战”时代下，一些实际存在的AI大模型安全问题引发公众的深切担忧，一是AI大模型作为复杂的软件系统，面临基础设施和软件安全风险，如系统漏洞、数据泄露、模型篡改等；二是AI大模型虽然提高了内容产出质量，但同时生成的内容可能包含误导信息或偏见内容，被用于不良目的，如钓鱼邮件和恶意软件的编写，降低网络攻击等犯罪门槛。

针对AI大模型存在的安全问题以及大众的担忧，结合监管要求，张凯认为要从实质安全运营的角度出发，基于AI大模型安全测评“数字风洞”，对基础设施安全和内容安全风险进行持续性检查。

首先，AI大模型安全测评“数字风洞”作为一个以安全检测为核心，以“产品乘服务”体系为手段，以安全风险防范化解为目标的测试评估平台，通过模拟各种网络攻击和系统入侵场景，检验AI大模型在不同攻击下的韧性，识别AI大模型基础设施存在的风险，预见和预防未来可能出现的威胁。张凯表示，同时基于永信至诚自主研发的风洞时光机系统，构建“测试-发现风险-迭代优化-再测试-再迭代优化”的科学测评流程，通过安全风险的反复验证、消除和收敛，提升实质性安全。

其次，针对内容安全风险，张凯强调AI大模型安全测评“数字风洞”的核心优势在于集成了永信至诚AI春秋大模型和“数字风洞”产品体系的能力。基于100+提示词检测模板以及20万+基础提问，AI大模型安全测评「数字风洞」以攻击者视角构建出引导AI大模型产生不当回答的测试载荷，对AI大模型的安全规则和过滤机制进行深入测试，评估其在处理潜在敏感、违法或不合规内容时的反应，确保AI大模型输出内容更符合社会伦理和法律法规要求，避免安全隐患变成安全事件。

对于AI大模型安全测评“数字风洞”的应用价值，张凯认为可以在多方面体现，例如，监管机构可以通过“数字风洞”对市场上已公开使用的AI大模型以及将要上市的AI大模型进行安全测评，为安全合规工作提供智能化手段支持；AI大模型厂商或AI大模型安全公司可以利用AI大模型安全测评“数字风洞”充分识别自身模型的弱点和安全内容漏洞，进一步强化产品本身的过滤系统和内容辨别能力。

2022年，我国人工智能核心产业规模已达5000亿元。据沙利文咨询预测，2024年我国人工智能市场规模将突破7993亿元。这也意味着，随着AI技术的广泛应用，AI大模型安全测试评估赛道拥有巨大的市场潜力和发展空间。张凯认为，AI发展的大体历程可以分为三个阶段：AI助手、AI工具以及AI智能体。在AI智能体阶段，“数字风洞”作为AI大模型的安全基座，持续支撑AI大模型常态化安全测试评估，为AI技术在千行百业的安全应用保驾护航，保障AI“数字健康”，带给世界安全感。（燕云）

校对：刘榕枝

本文地址：https://zhidexia.com/youtai-12028.html