
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向缺失与区间删失数据的多重填补方法:基于半参数转换模型的阿尔茨海默病生物标志物研究
【字体: 大 中 小 】 时间:2025年05月07日 来源:Computational Statistics & Data Analysis 1.5
编辑推荐:
针对区间删失失效时间数据中协变量存在缺失和检测限问题,研究人员提出基于半参数转换模型的多重填补方法,通过拒绝采样技术实现与失效时间模型的自动兼容。该方法在阿尔茨海默病(AD)生物标志物Aβ1-42数据分析中展现出高效性和稳健性,为复杂删失数据建模提供新思路。
在阿尔茨海默病(AD)研究中,生物标志物如β-淀粉样蛋白(Aβ1-42)的检测常面临双重挑战:由于定期随访导致的区间删失失效时间数据,以及因检测设备限制造成的协变量右删失。更复杂的是,脑脊液样本采集的非强制性导致关键生物标志物存在大量缺失值。传统方法如完整病例分析(CCA)会损失信息,而逆概率加权(IPW)对缺失机制模型敏感,现有技术均无法同时处理缺失和检测限问题。
新加坡教育部资助的研究团队开发了基于半参数转换模型的多重填补方法。该方法创新性地将拒绝采样整合到填补过程,自动保持与失效时间模型的兼容性。研究采用AD神经影像计划(ADNI)中轻度认知障碍(MCI)患者队列数据,通过Bernstein多项式逼近未知函数Λ(t),构建包含完全观测协变量W、缺失协变量X和右删失协变量Z的联合模型。
关键技术包括:1) 基于ADNI队列的区间删失失效时间建模;2) 整合拒绝采样的多重填补算法;3) 半参数转换模型框架下的参数估计;4) 通过模拟研究验证方法在存在协变量缺失和检测限时的性能。
数据与模型假设
建立包含完全观测协变量W、缺失协变量X和右删失协变量Z的联合模型,假设失效时间Ti服从半参数转换模型,其中Λ(t)为未知基函数。
初步估计
在完全数据情况下推导似然函数,采用筛最大似然估计方法,通过Bernstein多项式逼近Λ(t)。
多重填补估计方法
将填补模型分解为失效时间模型f(T,Δ|W,X,Z;θ)和协变量模型f(X,Z|W;ψ),通过拒绝采样生成与目标分布一致的填补值。
模拟研究
设置包含W、X1、X2和Z的四种协变量场景,结果显示新方法在偏差和均方误差上显著优于传统方法。
ADNI数据分析
应用于198例MCI患者数据,发现Aβ1-42水平与AD转化风险显著相关(HR=1.32, p<0.01),验证了方法在真实数据中的适用性。
结论与讨论
该研究首次实现了对同时存在区间删失失效时间、协变量缺失和检测限数据的统一分析框架。方法学创新体现在:1) 扩展Bartlett等2015年工作至更复杂的区间删失场景;2) 通过拒绝采样确保填补模型与实质模型的自动兼容;3) 在AD生物标志物研究中证实临床价值。未来可拓展至多状态模型和量化测量误差方向。论文发表于《Computational Statistics》,为复杂删失数据建模提供了重要方法论工具。
生物通微信公众号
知名企业招聘