利用低覆盖度全基因组测序对结构和单核苷酸变异进行高效基因分型填补:开启基因组研究新征程

《Genetics Selection Evolution》:High performance imputation of structural and single nucleotide variants using low-coverage whole genome sequencing

【字体: 时间:2025年03月29日 来源:Genetics Selection Evolution 3.6

编辑推荐:

  在全基因组测序(WGS)成本较高且结构变异(SV)基因分型困难的背景下,研究人员开展了利用低覆盖度 WGS 进行联合 SV 和单核苷酸变异(SNV)基因分型填补的研究。结果表明该方法对 SNV 和 SV 均有较高的准确性和召回率,为基因组关联研究(GWAS)提供了新策略。

  在生命科学研究的舞台上,基因研究一直是备受瞩目的焦点。随着测序技术的不断发展,全基因组测序(WGS)逐渐走进人们的视野。然而,WGS 虽有诸多优势,却因成本高昂,难以在大规模基因分型应用中广泛普及,比如在基因组关联研究(GWAS)中,它的使用频率远低于单核苷酸变异(SNV)基因分型技术,像 SNP 芯片和靶向基因分型检测等。同时,结构变异(SV)对生物性状的影响比 SNV 更大,但要准确进行基因分型却困难重重。在此背景下,研究人员迫切需要探索一种既经济又高效的方法,来实现全基因组变异的精准检测。
于是,来自国外多个研究机构的研究人员,如瓦赫宁根大学与研究中心(Wageningen University & Research)、爱丁堡大学罗斯林研究所(The Roslin Institute, University of Edinburgh)等,开启了一项极具意义的研究。他们以大西洋鲑(Salmo salar)为研究对象,旨在探究利用低覆盖度 WGS 结合基因分型填补技术,对 SNV 和 SV 进行联合基因分型的可行性。最终,研究取得了令人瞩目的成果,相关论文发表在《Genetics Selection Evolution》上。这一研究成果为基因组研究领域带来了新的曙光,为后续深入研究基因与性状的关系奠定了坚实基础。

研究人员在开展此项研究时,运用了多种关键技术方法。首先,构建了包含 365 个野生大西洋鲑个体的 SNV 和 SV 基因型参考面板,这些个体来自不同的欧洲种群。其次,利用 GLIMPSE 软件对不同覆盖度(1×、2×、3× 和 4×)的低覆盖度 WGS 数据进行基因分型填补分析。此外,通过特定的变异检测工具,如 SVTyper、DeepVariant 等对样本中的 SV 和 SNV 进行检测和基因分型 。

下面来看具体的研究结果:

  • 面板内样本 SNV 基因分型填补性能:研究发现,无论测序深度和后验概率(PP)截止值如何,GLIMPSE 对面板内样本的 SNV 基因分型填补都具有较高的准确性。PPV 在 1× 深度、PP>0.6 时为 0.96,在 4× 深度、PP>0.90 时可达 0.99。随着 PP 截止值的提高,SNV 基因分型填补的准确性增加,但召回率会降低。
  • 面板内样本缺失 SV 基因分型填补性能:对比两种基因分型填补方法,发现 “GLIMPSE + SVtyper” 方法能显著提高缺失 SV 基因分型填补的准确性,但会降低召回率。在 4× 深度时,“GLIMPSE + SVtyper” 方法的最大召回率可达 90.3%(PP>0.6),PPV 为 0.84,而仅依靠 SNV 与 SV 之间的连锁不平衡(LD)进行基因分型填补时,PPV 为 0.75。
  • 面板内样本重复和倒位 SV 基因分型填补性能:重复和倒位 SV 的 PPV 低于缺失 SV。“GLIMPSE + SVtyper” 方法对这两种 SV 的基因分型填补效果更好,且随着测序深度增加,召回率上升。在 4× 深度、PP>0.9 时,重复和倒位 SV 的最佳总体性能分别为 PPV 0.77 和 0.82,召回率 75.2% 和 83.3%。
  • SV 长度对基因分型填补准确性的影响:研究表明,SV 长度会影响基因分型填补的准确性。对于所有类型的 SV,较短的 SV 基因分型填补 PPV 较高,较长的 SV 则较低。“GLIMPSE + SVtyper” 方法在各 SV 长度范围内的 PPV 更高,且在 4× 深度时,多数情况下 PPV 会有所提高。
  • 合并面板内 SV 基因分型填补结果:将 “GLIMPSE” 和 “GLIMPSE + SVtyper” 两种方法的结果合并后发现,逻辑过滤策略会使所有 SV 类型的 PPV 略有降低,召回率略有提高。其中,缺失 SV 的表现最佳,在 1× 深度时就能填补参考面板中约 84.4% 的缺失 SV,PPV 接近 80%。
  • 面板外样本中检测到的 SV 和 SNV:在 20 个面板外样本中,共检测到 44,779 个 SV,经过人工筛选后得到 6301 个高可信度 SV。同时,保留了 4,009,327 个 SNV。主成分分析(PCA)显示,面板外样本与面板内挪威南部样本的聚类更紧密。
  • 面板外样本基因分型填补性能:面板外样本的 SNV 基因分型填补 PPV 在 0.92 - 0.98 之间,但召回率明显低于面板内样本。缺失 SV 基因分型填补性能略高于面板内样本,“GLIMPSE + SVtyper” 方法的 PPV 可接近或超过 0.9。重复和倒位 SV 的基因分型填补 PPV 与面板内样本相似。

研究结论和讨论部分指出,本研究成功应用 GLIMPSE 软件对大西洋鲑进行了低覆盖度 WGS 的全基因组变异基因分型填补。虽然 SV 的基因分型填补性能低于 SNV,但考虑到直接使用 WGS 数据检测 SV 的高假阳性率,低覆盖度 WGS 的 SV 基因分型填补准确性和召回率令人满意。此外,研究还发现 “GLIMPSE + SVtyper” 方法对较长 SV 的基因分型填补准确性提升更为显著。不过,研究也存在一些局限性,如参考面板基于旧的基因组版本,且未涵盖所有类型的 SV。未来可通过更新参考面板,利用长读长测序技术等手段加以改进。总体而言,该研究为其他物种的类似研究提供了可借鉴的框架,有望推动基因组研究领域的进一步发展,为深入了解基因与性状的关系,以及在商业养殖和物种保护等方面的应用奠定了重要基础。

婵炴垶鎸搁鍫澝归崶鈹惧亾閻熼偊妲圭€规挸瀛╃€靛ジ鏁傞悙顒佹瘎闁诲孩绋掗崝鎺楀礉閻旂厧违濠电姴娲犻崑鎾愁潩瀹曞洨鐣虹紓鍌欑濡粓宕曢鍛浄闁挎繂鐗撳Ο瀣煙濞茶骞橀柕鍥ㄥ哺瀵剟骞嶉鐣屾殸闂佽偐鐡旈崹铏櫠閸ф顥堥柛鎾茬娴狀垶鏌曢崱妤婂剱閻㈩垱澹嗗Σ鎰板閻欌偓濞层倕霉閿濆棙绀嬮柍褜鍓氭穱铏规崲閸愨晝顩烽柨婵嗙墦濡鏌涢幒鎴烆棡闁诲氦濮ょ粚閬嶅礃椤撶姷顔掗梺璇″枔閸斿骸鈻撻幋锔藉殥妞ゆ牗绮岄埛鏍煕濞嗘劕鐏╂鐐叉喘閹秹寮崒妤佹櫃

10x Genomics闂佸搫鍊瑰姗€骞栭—娓媠ium HD 閻庢鍠掗崑鎾绘煕濮樼厧鐏犵€规洜鍠撶槐鎺楀幢濮橆剙濮冮梺鍛婂笒濡粍銇旈幖浣瑰仢闁搞儮鏅滈悾閬嶆煕韫囧濮€婵炴潙妫滈妵鎰板即閻樼數鐓佺紓浣告湰濡炶棄螞閸ф绀嗛柛鈩冡缚閳ь兛绮欓弫宥夋晸閿燂拷

濠电偛妫庨崹鑲╂崲鐎n偆鈻旈悗锝庡幗缁佺櫉wist闂侀潧妫楅敃锝囩箔婢舵劕妫樻い鎾跺仜缂嶄線鏌涢弽銊у⒈婵炲牊鍘ISPR缂備焦绋掗惄顖炲焵椤掆偓椤︿即鎮ч崫銉ゆ勃闁逞屽墴婵″鈧綆鍓氶弳鈺呮倵濞戞瑥濮冮柛鏃撴嫹

闂佸憡顨嗗ú婊呭垝韫囨稒鍤勯柣鎰嚟閵堟挳骞栭弶鎴犵闁告瑥妫濆濠氬Ω閵夛絼娴烽柣鐘辩劍瑜板啴鎮ラ敓锟� - 濠电儑绲藉畷顒勫矗閸℃ḿ顩查柛鈩冾嚧閹烘挾顩烽幖杈剧秵閸庢垵鈽夐幘顖氫壕婵炴垶鎼╂禍婊冪暦閻旇櫣纾奸柛鈩冭壘閸旀帡鎮楅崷顓炰槐闁绘稒鐟ч幏瀣箲閹伴潧鎮侀梺鍛婂笧婢ф寮抽悢鐓庣妞ゆ柨鐏濈粣娑㈡煙鐠ㄥ鍊婚悷銏ゆ煕濞嗘ê鐏ユい顐㈩儔瀹曠娀寮介顐e浮瀵悂鏁撻敓锟�

婵炴垶鎸搁鍫澝归崶顒€违濠电姴瀚惌搴ㄦ煠瀹曞洤浠滈柛鐐存尦閹藉倻鈧綆鍓氶銈夋偣閹扳晛濡虹紒銊у閹峰懎饪伴崘銊р偓濠氭煛鐎n偄濮堥柡宀€鍠庨埢鏃堝即閻樿櫕姣勯柣搴㈢⊕閸旀帡宕濋悢鐓幬ラ柨鐕傛嫹

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号