长读长基因组测序在髓系肿瘤基因分析中的应用评估
【字体:
大
中
小
】
时间:2025年10月02日
来源:The Journal of Molecular Diagnostics 3.4
编辑推荐:
本研究针对短读长测序(sWGS)在检测结构变异(SV)和重复区域的局限性,系统评估了Oxford Nanopore(ONT)和PacBio HiFi长读长测序技术在AML/MDS基因分析中的性能。结果显示长读长测序对SNV召回率>96%,精准度>91%,可准确解析短读长误判的插入事件,显著提升临床基因检测的准确性。
在血液系统恶性肿瘤的诊断中,基因组评估已成为不可或缺的手段,尤其是对于急性髓系白血病(AML)和骨髓增生异常综合征(MDS)患者。目前临床常规检测依赖多种技术组合,包括核型分析、荧光原位杂交(FISH)和靶向基因测序,流程复杂且耗时。更为重要的是,当前主流的短读长全基因组测序(sWGS)技术虽然在检测点突变和大型拷贝数变异(CNV)方面表现良好,但在解析结构变异(SV)、重复序列区域以及相位信息方面存在显著局限。这些局限性可能导致漏检或误判,尤其是一些位于基因内含子区的插入事件容易被错误识别为基因间易位,从而影响临床报告的准确性。
随着测序技术的快速发展,长读长测序平台——如牛津纳米孔(Oxford Nanopore Technologies, ONT)和太平洋生物科学(Pacific Biosciences, PacBio)的HiFi测序——逐渐展现出独特优势。它们能够产生长达数万碱基的读长,覆盖复杂重复区域,并直接提供单倍型相位信息,为遗传变异解读带来了新的可能。然而,这些技术在肿瘤体细胞变异检测中的应用尚未得到系统评估,特别是在AML和MDS这类高度异质性的血液肿瘤中。
为此,来自华盛顿大学医学院的研究团队开展了一项深入研究,旨在系统比较长读长测序(包括ONT和HiFi)与已建立的短读长WGS方法在髓系肿瘤基因分析中的性能差异。该研究近期发表于《The Journal of Molecular Diagnostics》,为长读长测序的临床转化提供了重要依据。
在研究过程中,团队收集了26例AML和MDS患者的骨髓或外周血样本,并同时进行了ONT、HiFi和Illumina短读长(sWGS)测序。平均测序覆盖度分别为59X、34X和52X。研究人员开发了一套自动化分析流程,针对临床关注的64个基因中的单核苷酸变异(SNV)、插入缺失(indel)、拷贝数变异(CNV)和结构变异(SV)进行靶向分析,并与sWGS结果进行严格比对。
关键技术方法包括:使用Dorado、Pepper-Margin-DeepVariant和ClairS-TO进行碱基识别和变异 calling;通过WhatsHap进行单倍型分型;使用qDNAseq进行拷贝数分析;应用Sniffles2和Severus检测结构变异;所有样本均来源于经患者同意的组织库,包括初治AML和MDS样本。
研究结果显示,在单核苷酸变异(SNV)检测方面,长读长平台表现出较高的灵敏度与特异性。ONT和HiFi对sWGS检测出的SNV召回率分别达到96.4%和100%,精准度分别为91.5%和95.2%。而在插入缺失(indel)检测中,召回率分别为81.0%和66.7%,精准度分别为78.3%和42.9%,表明indel检测仍是长读长测序的一个挑战。值得注意的是,大多数假阴性indel发生在低覆盖度或高重复序列区域,例如一个位于NF1基因同聚区附近的单碱基插入未能被检出。
研究的一大亮点是单倍型分型分析。平均约88%的目标基因可实现完全连续分型,研究人员借此明确了9对同一基因内共发生的变异之间的相位关系,例如在RUNX1、TET2和TP53中鉴定出6对反式(trans)突变和2对顺式(cis)突变。此外,单倍型特异性变异等位基因频率(haplotype-specific VAF)分析能够有效区分体细胞突变与胚系多态性,在肿瘤纯度不足100%的样本中尤其有用。
在结构变异(SV)分析中,长读长测序显示出显著优势。所有复发型SV(共12例)均被长读长平台准确检出,无假阳性。然而,在非复发SV中,sWGS与长读长数据之间存在较多部分一致(单断点匹配)的呼叫,进一步分析表明,这些事件中约58%实为长读长数据中明确识别的内含子插入,而sWGS错误地将其报告为基因间易位(BND)。这些插入多来自移动遗传元件,未被当前参考基因组收录。基于这一发现,研究人员开发了一种新的过滤方法,利用长读长群体数据库(如HPRC SV集)过滤sWGS中的假阳性BND呼叫,使此类潜在错误减少46.7%。
拷贝数变异(CNV)分析结果高度一致:长读长测序在基因水平检出缺失与扩增的召回率超过93%,精准度超过95%。差异主要发生在较低VAF(如亚克隆)或较小片段(<2 Mbp)的CNV中,这些在sWGS中常因过滤阈值而被排除。
研究结论表明,长读长测序在检测AML和MDS中的结构变异、拷贝数变异和单核苷酸变异方面已达到与sWGS相当的临床性能水平,并且在解析复杂结构变异、纠正短读长在重复区域的误判、提供单倍型信息以辅助起源判定方面具有独特优势。尽管indel检测精度仍有提升空间,但随着覆盖度提高和算法优化,长读长测序有望成为未来肿瘤基因临床检测的重要工具。此外,该研究还示范了如何将长读长数据衍生知识反馈至短读长分析流程,从而在不改变现有临床检测体系的前提下,显著提升结果准确性。
这项研究不仅证实了长读长测序技术在髓系肿瘤基因分析中的可行性,也为多平台整合策略提供了实践依据,对未来肿瘤基因组学的临床转化具有重要指导意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号