超越RMSE与MAE:EAUC指标揭示双变量回归模型中的隐藏偏差与不公平性

《IEEE Transactions on Neural Networks and Learning Systems》:Beyond RMSE and MAE: Introducing EAUC to Unmask Hidden Bias and Unfairness in Dyadic Regression Models

【字体: 时间:2025年12月02日 来源:IEEE Transactions on Neural Networks and Learning Systems 8.9

编辑推荐:

  本研究针对双变量回归模型(如推荐系统中的用户-产品评分预测)存在的预测偏差问题,提出了一种新型评估指标EAUC(Eccentricity Area Under the Curve)。通过分析六个真实世界数据集(涵盖生物医学、金融和产品推荐领域),研究人员发现传统全局误差指标(如RMSE和MAE)无法检测模型对实体平均观测值的偏向(即偏心偏差),而EAUC能有效量化这种偏差,为关键领域(如精准用药剂量预测)的算法公平性评估提供新维度。

  
在人工智能渗透社会决策各个角落的今天,双变量回归模型作为预测实体对间数值关系的核心技术(如用户对产品的评分预测、患者药物剂量调整),其预测公平性直接关系到机会平等和社会公正。然而,当前研究界长期依赖根均方误差(RMSE)等全局指标评估模型性能,这种"唯误差论"的评估范式可能掩盖了模型在特殊场景下的系统性偏差。欧洲《人工智能法案》和美国《人工智能权利法案》相继强调算法必须避免强化历史歧视模式,但双变量数据中实体观测值分布的非均匀性导致的"偏心偏差"(eccentricity bias)始终缺乏有效检测工具。这种偏差会使模型预测过度偏向用户或项目的平均历史值,导致在偏离常规但至关重要的案例中出现比随机预测更差的性能,从而引发医疗过量用药、金融歧视性定价等严重社会风险。
为解决这一隐患,来自西班牙拉科鲁尼亚大学LIDIA研究组的Jorge Paz-Ruza等学者在《IEEE Transactions on Neural Networks and Learning Systems》发表研究,通过系统分析三个关键领域(生物医学、金融、产品推荐)的六大数据集,揭示传统评估指标的局限性,并提出创新性评估指标EAUC。该研究首先在Netflix Prize数据集上通过矩阵分解(MF)模型演示了典型现象:当观测值接近用户与项目平均值的中间值(DMVui)时模型预测精准,但随着观测值偏离DMVui(即偏心度Eccui增加),模型误差急剧上升,甚至劣于随机预测。
ui与预测误差|r?ui-rui|关系图'>这一现象在用户项目组合高低分倾向场景中尤为显著:模型总是将预测值拉向DMVui,假设批判性用户不会喜欢高口碑电影,或乐观用户不会批评劣质产品。
为量化这种偏差,研究团队设计了EAUC指标,其计算流程包括:基于训练集计算每个用户(u)和项目(i)的平均观测值(r?u和r?i),继而计算测试样本的偏心度(Eccui=|rui-DMVui|)和绝对预测误差(εui=|r?ui-rui|),按偏心度排序后计算曲线下面积并归一化。EAUC值域为[0,1],越低表明模型偏心偏差越小。理想无损模型EAUC=0,而始终预测DMVui的朴素预测器EAUC=0.5。该指标可通过两种方式增强模型评估:作为偏差感知维度与RMSE结合评价(如低RMSE高EAUC模型可能不适用于高公平性要求场景),或通过偏心度-误差曲线直观展示模型在关键案例中的表现劣化情况。
关键技术方法方面,研究选取了矩阵分解(MF)、贝叶斯SVD++、图卷积矩阵补全(GC-MC)和Glocal-K等主流双变量回归模型,在六个真实世界数据集(包括Netflix Prize、MovieLens 1M、GDSC1药物敏感性、CTRPv2癌症药效、IMF DOTS国际贸易和Kiva小额信贷数据)上进行对比。实验采用90/10训练测试分割,仅使用隐式反馈信息,对部分数据集进行降采样以模拟现实稀疏场景。通过计算数据集的Kolmogorov-Smirnov均匀性统计量(DKSD)评估实体观测值分布非均匀性对偏差的诱导程度。
研究结果部分通过多维度实验验证了EAUC的有效性:
全局误差指标与偏心偏差的脱节
如表III所示,在药物敏感性数据集CTRPv2中,贝叶斯SVD++模型的RMSE(1.244)显著高于其他模型,但EAUC(0.074)却最低,表明其偏心偏差控制最佳。而在Kiva小额信贷数据中,所有模型的EAUC均超过随机基线(0.408),MF模型甚至达到0.440,证实金融场景中严重的偏心偏差无法被RMSE(0.405)和MAE(0.205)所察觉。
偏心度-误差曲线的一致性规律
图5显示所有数据集上模型误差均随偏心度增加而近线性上升,尤其在Netflix和Kiva等高DKSD值数据集中,模型倾向于预测DMVui附近值。这种偏差在生物医学场景可能导致患者用药过量,在金融场景引发歧视性定价。
EAUC引导的偏差校正实验
研究团队通过四种后训练校正方法(线性回归、带ML-RUS采样的逻辑校正、随机森林校正)对MF模型进行偏差修正。如表IV所示,虽然校正后RMSE略有上升(0.879→0.977),但EAUC显著降低(0.354→0.253),证明EAUC可作为公平性优化的指导指标。
结论部分强调,双变量回归模型的偏心偏差是普遍存在且未被充分认知的风险源,传统评估指标RMSE/MAE由于其全局平均特性无法捕捉这一偏差。EAUC作为首个体现在所有偏心度水平上模型性能的指标,为关键领域(如精准医疗剂量预测、公平信贷评估)的算法部署提供了必要的偏差检测工具。研究者进一步提出EAUC的三大应用方向:作为后训练校正的指导指标、作为可微分损失函数融入训练过程、作为多目标AutoML系统中的公平性组件。该研究不仅揭示了现有评估范式的重大缺陷,更为构建真正公平的双变量回归系统提供了方法论基础,对受欧盟《人工智能法案》等法规约束的高风险应用具有迫切现实意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号