基于压缩感知技术的重叠池测序数据肿瘤突变负荷计算方法研究

【字体: 时间:2025年05月21日 来源:BMC Bioinformatics 2.9

编辑推荐:

  本研究针对肿瘤突变负荷(TMB)检测成本高的问题,创新性地采用压缩感知(CS)技术从重叠池测序数据中重构TMB值。通过正交匹配追踪(OMP)和基追踪(BP)算法验证,证实10样本混合测序仍可保留90%以上SNP信息,BP模型在0.6倍样本量的压缩率下可实现ρ=0.998的高精度重建,显著降低40%测序成本。该研究为临床大样本免疫治疗生物标志物检测提供了经济高效的解决方案。

  

肿瘤免疫治疗领域近年来取得突破性进展,其中肿瘤突变负荷(Tumor Mutation Burden, TMB)作为预测免疫检查点治疗(Immune Checkpoint Therapy, ICT)疗效的关键生物标志物备受关注。TMB指肿瘤组织编码区非同义体细胞突变数量,其数值越高意味着可能产生更多新抗原,从而增强免疫系统对癌细胞的识别能力。然而当前TMB检测主要依赖全外显子测序(Whole Exome Sequencing, WES),每个样本需单独建库测序,导致临床大样本筛查面临高昂成本瓶颈。

针对这一挑战,东南大学数字医学工程全国重点实验室联合江苏省肿瘤医院的研究团队在《BMC Bioinformatics》发表创新性研究。该团队将信号处理领域的压缩感知(Compressed Sensing, CS)理论引入基因组学,开发出基于重叠池测序的TMB计算方法。通过构建样本混合测序策略,将传统线性增长的测序次数降为亚线性增长,在保证检测精度的前提下显著降低成本。

研究采用三大关键技术:1)基于TCGA数据库6669例多癌种WES数据构建稀疏突变矩阵;2)设计伯努利随机测量矩阵实现样本重叠混合(最多10样本/池);3)对比基追踪(Basis Pursuit, BP)和正交匹配追踪(Orthogonal Matching Pursuit, OMP)两种重构算法性能。通过覆盖度阈值优化(10x-15x)解决混合测序的SNP漏检问题,并建立包含相关系数(ρ)、准确率(Accuracy)和召回率(Recall)的多维度评估体系。

SNP calling from pooling sequencing data
实验证实10样本混合测序经15x深度过滤后,SNP漏检率仅10.06%,假阳性率降至8.83%。覆盖度提升有效补偿了等位基因丢失问题,验证了重叠测序策略的可行性。

TMB reconstruction across varied compression levels
在压缩率k=0.6(测序次数为样本量的60%)时,BP模型实现ρsample=0.998、Recall=0.996的优异性能,显著优于OMP模型(ρ=0.986)。计算耗时分析显示BP模型需更长时间但精度稳定,而OMP模型在稀疏矩阵(突变率1-2%)表现较好。

TMB reconstruction across varied sample characteristics
BP模型对样本量和突变比例变化均具鲁棒性,而OMP模型在样本量>200或突变比例>2%时性能下降。该发现为不同癌种(如高TMB的肺癌与低TMB的神经内分泌瘤)的算法选择提供指导。

研究结论创新性地将信号压缩理论应用于基因组学领域,首次证实通过0.6倍测序量即可准确重构TMB值。BP模型在多数场景下展现临床级精度(误差<2%),而OMP模型更适用于资源受限的低TMB检测。该方法突破传统"一样本一建库"模式,为开展大规模免疫治疗疗效预测研究提供经济高效的技术路径。未来通过优化测量矩阵设计和引入深度学习算法,有望在保持精度的前提下实现更高压缩率,推动TMB检测在临床诊疗中的普及应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号