突破传统:单调复合分位数回归神经网络精准解析删失数据治愈率

【字体: 时间:2025年05月09日 来源:Computational Statistics & Data Analysis 1.5

编辑推荐:

  在生存数据分析中,传统方法因未考虑疾病治愈特征及变量间复杂非线性关系易致误差。研究人员开展 “Monotone composite quantile regression neural network for censored data with a cure fraction” 研究,提出 CCQRNN 模型。结果显示该模型预测优势明显,能有效避免分位数交叉现象,为生存数据分析提供新方法。

  在医学研究和临床实践中,生存分析是评估疾病预后和治疗效果的重要手段。传统的生存分析通常假定,只要随访时间足够长,所有研究对象最终都会经历感兴趣的事件,比如疾病复发或死亡。但随着医疗技术的飞速发展,许多疾病是可以被治愈的,而且部分患者无论随访多久,都不会经历这些事件,他们被视为对该事件不易感。若在分析生存数据时忽视这一治愈或不易感特征,很可能会导致错误的结果。同时,以往大多数研究聚焦于变量间呈线性结构的经典统计模型,然而现实中变量之间往往存在复杂的非线性关系,这使得线性假设不再成立。在此背景下,开展一项能精准分析含治愈比例的删失数据的研究迫在眉睫。
为了解决这些问题,来自未知研究机构的研究人员进行了 “Monotone composite quantile regression neural network for censored data with a cure fraction” 的研究。他们提出了一种删失治愈单调复合分位数回归神经网络(CCQRNN)模型,该研究成果发表在《Computational Statistics 》上。这一研究成果意义重大,它为预测患者的治愈率和未治愈患者的生存时间提供了新的有效方法,有助于医生更准确地评估患者预后,制定更合理的治疗方案,在生命科学和健康医学领域具有重要的应用价值。

研究人员在这项研究中用到了多种关键技术方法。首先是数据增强技术,通过对观测数据进行扩充,增加数据的丰富度;接着采用交叉验证和网格搜索技术,来选择最优的隐藏层节点 J 和正则化参数λ,从而优化模型性能;利用逻辑回归(Logistic regression)对治愈概率进行建模;运用单调复合分位数回归神经网络(MCQRNN)对未治愈(易感)受试者的生存时间进行分析 。

下面来详细介绍研究结果:

  • CCQRNN 模型构建:研究人员整合人工神经网络(ANN)技术和分位数回归(QR)模型,考虑治愈比例,构建了 CCQRNN 模型。在模型中,将受试者的生存时间分解,同时考虑了未治愈和已治愈受试者的情况。通过定义相关的条件分布、分位数函数等,建立了完整的模型架构,为后续的分析和预测奠定基础。
  • 算法设计:提出一种基于数据增强的迭代算法。该算法通过多次迭代,不断更新治愈指标和相关参数的估计值。具体包括从伯努利分布中生成治愈指标,利用最大化似然函数更新参数,以及基于网格和随机数对删失观测进行更新等操作。通过这些步骤,最终实现对治愈率和不同分位数水平下响应的预测。
  • 模拟研究:将 CCQRNN 模型与三种先进方法(IMP、DAU 和 CQRNN)进行比较。结果显示,在响应与预测变量呈线性关系的情况下,DAU 和 IMP 方法的预测性能略优于 CCQRNN;但在非线性关系的设定中,CCQRNN 表现出色,其均方误差(MSE)和平均绝对误差(MAE)显著更小。同时,在预测高 quantile 水平的响应时,CCQRNN 比不考虑治愈率的 CQRNN 表现更优。此外,CCQRNN 能有效确保分位数函数不交叉,而其他对比方法存在交叉问题。
  • 实际数据分析:研究人员将 CCQRNN 模型应用于肾脏移植数据和肺癌数据。在肾脏移植数据中,发现患者年龄与治愈率显著相关,且 CCQRNN 在预测生存时间方面,其 MSE、MAE 和分位数损失(QL)在几乎所有考虑的分位数水平上均低于其他方法。在肺癌数据中,年龄对治愈率有显著正向影响,CCQRNN 同样展现出良好的预测性能,并且保证了分位数预测不交叉。

研究结论和讨论部分指出,CCQRNN 模型结合了基于删失数据的增广方法,通过逻辑回归和 MCQRNN 模型分别对治愈比例和易感受试者进行建模,为预测受试者的治愈率和未治愈受试者的生存时间提供了有效途径,同时成功解决了分位数交叉的问题。模拟研究表明,该方法在大多数情况下,尤其是存在非线性关系时,预测准确性优于其他竞争方法。在实际应用中,CCQRNN 模型在两个真实数据集上均取得了良好的效果。然而,研究也存在一些可以进一步探索的方向,例如可以用其他非参数方法替代逻辑回归模型来分析治愈比例,还可将该方法扩展到处理区间删失数据等 。这些后续研究有望进一步完善生存数据分析的方法体系,为医学研究和临床实践提供更强大的工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号