
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于规则分类器的CONFIDERAI评分函数:一种新型的保形预测框架及其在安全关键系统中的应用
【字体: 大 中 小 】 时间:2025年07月31日 来源:Pattern Recognition 7.6
编辑推荐:
为解决规则分类器缺乏统计验证框架的问题,研究人员提出CONFIDERAI评分函数,通过融合规则几何相似性与性能指标构建保形预测集,在10个真实数据集(如心血管疾病预测、DNS隧道检测)中实现误差控制与精度提升,为安全关键领域提供可解释的可靠性保障。
在人工智能安全领域,规则分类器因其透明性备受青睐,但传统方法缺乏对预测结果的概率化可靠性评估。这种局限性在医疗诊断、自动驾驶等安全关键场景中尤为突出——当模型将高风险患者误判为健康,或将碰撞风险误标为安全时,后果不堪设想。现有保形预测(CP)框架虽能为机器学习输出提供统计保证,但其通用评分函数未能充分利用规则分类器特有的几何结构与重叠特性。
意大利国家研究委员会电子、信息工程与电信研究所(CNR-IEIIT)的Sara Narteni团队在《Pattern Recognition》发表研究,提出CONFIDERAI创新评分函数。该方法通过量化规则超矩形的空间重叠度与性能指标,构建具有统计保证的预测集,并在10个真实数据集上验证其有效性。
关键技术包括:1) 基于逻辑学习机(LLM)生成规则集;2) 设计几何规则相似性函数量化超矩形重叠区域;3) 构建保形临界集(CCS)确定高置信度预测区域;4) 采用车辆编队、心血管疾病(CHD)等10个真实数据集验证,包含临床指标、网络流量等多维特征。
4.1 规则分类器几何表征
将每条规则转化为D维特征空间的超矩形,通过边界坐标计算体积VHrk,定义规则间重叠体积Voverlap作为相似性基础。
4.3 CONFIDERAI评分函数
创新性融合两项核心指标:1) 样本点与规则边界的归一化距离γ(x,rk);2) 规则与同类/异类规则的平均重叠度q?。最终评分s(x,y)通过乘积形式反映规则协同效应,在DNS隧道检测中使错误率降低40%。
5.2 K近邻评分对比
在车辆编队数据中,当ε=0.05时,CONFIDERAI单例预测集比例达75%,较KNN评分(54%)显著提升,且空集率维持在1%以下。
6.5 保形临界集验证
通过重构CHD数据集标签,新规则将阳性预测值(PPV)从0.74提升至0.78,F1分数提高12%,证实CCS能精确定位高可靠性区域。
该研究开创性地将几何拓扑引入保形预测框架,其核心价值体现在:1) 为规则系统提供严格的1-ε错误上界;2) 通过CCS实现模型自优化,在Fire Alarm数据集中将误报率降低至0.1%;3) 保持规则模型的解释性优势,临床决策等场景可直接追溯预测依据。未来可扩展至多标签分类与回归任务,为高风险AI系统提供新的可靠性建设范式。
生物通微信公众号
知名企业招聘