RNA 测序 SNP 基因分型填补策略:猪基因组研究的新突破

【字体: 时间:2025年03月14日 来源:BMC Genomics 3.5

编辑推荐:

  为解决 RNA-seq 数据基因分型信息缺失问题,研究人员评估 RNA-SNPs 基因分型填补准确性,为相关研究提供指导。

  RNA 测序(RNA-seq)是一种强大的转录组分析工具,能够助力研究基因表达的调控机制。它就像一个精密的探测器,能深入细胞内部,检测基因的活动情况。然而,RNA-seq 也存在 “短板”。在检测非转录区域或低表达水平区域的遗传变异时,它常常 “力不从心”,导致检测到的遗传变异比 DNA 测序(DNA-seq)少很多。这就好比用一把有缺口的尺子去测量物体,得到的结果并不完整。这些缺失的基因型信息会影响下游分析的准确性和可靠性,就像拼图缺了关键的几块,无法完整呈现图案。为了解决这一问题,华南农业大学的研究人员开展了一项关于 RNA-seq 数据中 SNP(单核苷酸多态性,Single Nucleotide Polymorphism)基因分型填补策略的研究,相关成果发表在《BMC Genomics》上。
研究人员主要运用了以下关键技术方法:首先,利用来自 300 头猪的全基因组测序(Whole Genome Sequencing,WGS)数据作为 “金标准”,这些数据就像是精准的基因地图。接着,以猪基因组参考面板(Pig Genomic Reference Panel,PGRP)作为参考面板,它为基因分型填补提供了重要的参照依据。然后,通过特定软件对数据进行处理和分析,如用 SnpEff 分析 RNA-seq 样本和 WGS 数据,用 Beagle、Minimac4 和 Impute5 进行基因分型填补等。

研究结果如下:

  • 目标面板:通过基于 RNA-seq 数据的 SNP 特征对 WGS 数据进行掩码处理,得到目标面板。研究发现,RNA-SNP 数据中八个基因组区域的 SNP 平均占比为 97.31%,WGS 数据中为 99.77%,且目标面板 SNP 与实际 RNA-SNP 分布高度一致,相关系数达 0.99。
  • Chip-SNPs 和 RNA-SNPs 的填补准确性:RNA-SNPs 的平均 CR(一致性比率,Concordance Rate)为 0.895 - 0.933,(决定系数)为 0.745 - 0.817;Chip-SNPs 的平均 CR 为 0.873 - 0.909,为 0.629 - 0.698。RNA-SNPs 在各基因组区域的填补准确性均高于 Chip-SNPs,但在 “基因间” 区域值相对较低。同时,研究还发现 SNP 计数与填补准确性密切相关,当 RNA-SNPs 的 SNP 计数每 Mb 超过 200 时,填补准确性趋于稳定。
  • 填补后质量控制指标:研究人员用 MAF(次要等位基因频率,Minor Allele Frequency)和(剂量 R 平方,Dosage R-Squared)进行质量控制。结果显示,排除低 MAF 区域后,CR 随 MAF 质量控制阈值升高而降低,在排除 MAF < 0.05 的 SNP 后显著提高;质量控制时,CR 和随阈值升高而增加,但 SNP 保留率迅速下降。这表明 MAF 和可作为有效的质量控制指标,选择合适阈值时需平衡准确性和 SNP 保留率。
  • 常见填补软件评估:评估 Beagle v5.4、Minimac4 v4.1.6 和 Impute5 v1.2.0 三种软件性能,发现三者全局准确性无显著差异,在 “基因间” 区域填补准确性最低。在计算资源消耗方面,Minimac4 平均运行时间最短,Impute5 最长;Impute5 内存使用最少,Beagle 最多。单线程条件下,Minimac4 计算效率更优,而多线程条件下 Beagle 并发支持最高且功能集成度高。

研究结论和讨论部分指出,RNA-SNPs 在基因分型填补准确性上优于 Chip-SNPs,过滤 MAF < 0.05 的 SNP 可提高准确性和 SNP 保留率,基于的质量控制则需权衡准确性和 SNP 产量。虽然三种软件在未进行质量控制时填补准确性相近,但选择软件时还需考虑可用性和资源效率。不过,该研究也存在一定局限性,如测序深度可能影响填补准确性,研究结果在其他物种中的通用性也需进一步验证。总体而言,这项研究为 RNA-SNPs 基因分型填补策略提供了有价值的参考,有助于推动基因组和转录组研究的发展,就像为基因研究领域点亮了一盏新的明灯,为后续研究指引了方向。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号