编辑推荐:
为解决 RNA-seq 数据基因分型信息缺失问题,研究人员评估 RNA-SNPs 基因分型填补准确性,为相关研究提供指导。
RNA 测序(RNA-seq)是一种强大的转录组分析工具,能够助力研究基因表达的调控机制。它就像一个精密的探测器,能深入细胞内部,检测基因的活动情况。然而,RNA-seq 也存在 “短板”。在检测非转录区域或低表达水平区域的遗传变异时,它常常 “力不从心”,导致检测到的遗传变异比 DNA 测序(DNA-seq)少很多。这就好比用一把有缺口的尺子去测量物体,得到的结果并不完整。这些缺失的基因型信息会影响下游分析的准确性和可靠性,就像拼图缺了关键的几块,无法完整呈现图案。为了解决这一问题,华南农业大学的研究人员开展了一项关于 RNA-seq 数据中 SNP(单核苷酸多态性,Single Nucleotide Polymorphism)基因分型填补策略的研究,相关成果发表在《BMC Genomics》上。
研究人员主要运用了以下关键技术方法:首先,利用来自 300 头猪的全基因组测序(Whole Genome Sequencing,WGS)数据作为 “金标准”,这些数据就像是精准的基因地图。接着,以猪基因组参考面板(Pig Genomic Reference Panel,PGRP)作为参考面板,它为基因分型填补提供了重要的参照依据。然后,通过特定软件对数据进行处理和分析,如用 SnpEff 分析 RNA-seq 样本和 WGS 数据,用 Beagle、Minimac4 和 Impute5 进行基因分型填补等。
研究结果如下:
目标面板 :通过基于 RNA-seq 数据的 SNP 特征对 WGS 数据进行掩码处理,得到目标面板。研究发现,RNA-SNP 数据中八个基因组区域的 SNP 平均占比为 97.31%,WGS 数据中为 99.77%,且目标面板 SNP 与实际 RNA-SNP 分布高度一致,相关系数达 0.99。
Chip-SNPs 和 RNA-SNPs 的填补准确性 :RNA-SNPs 的平均 CR(一致性比率,Concordance Rate)为 0.895 - 0.933,r 2 (决定系数)为 0.745 - 0.817;Chip-SNPs 的平均 CR 为 0.873 - 0.909,r 2 为 0.629 - 0.698。RNA-SNPs 在各基因组区域的填补准确性均高于 Chip-SNPs,但在 “基因间” 区域r 2 值相对较低。同时,研究还发现 SNP 计数与填补准确性密切相关,当 RNA-SNPs 的 SNP 计数每 Mb 超过 200 时,填补准确性趋于稳定。
填补后质量控制指标 :研究人员用 MAF(次要等位基因频率,Minor Allele Frequency)和D R 2 (剂量 R 平方,Dosage R-Squared)进行质量控制。结果显示,排除低 MAF 区域后,CR 随 MAF 质量控制阈值升高而降低,r 2 在排除 MAF < 0.05 的 SNP 后显著提高;D R 2 质量控制时,CR 和r 2 随阈值升高而增加,但 SNP 保留率迅速下降。这表明 MAF 和D R 2 可作为有效的质量控制指标,选择合适阈值时需平衡准确性和 SNP 保留率。
常见填补软件评估 :评估 Beagle v5.4、Minimac4 v4.1.6 和 Impute5 v1.2.0 三种软件性能,发现三者全局准确性无显著差异,在 “基因间” 区域填补准确性最低。在计算资源消耗方面,Minimac4 平均运行时间最短,Impute5 最长;Impute5 内存使用最少,Beagle 最多。单线程条件下,Minimac4 计算效率更优,而多线程条件下 Beagle 并发支持最高且功能集成度高。
研究结论和讨论部分指出,RNA-SNPs 在基因分型填补准确性上优于 Chip-SNPs,过滤 MAF < 0.05 的 SNP 可提高准确性和 SNP 保留率,基于D R 2 的质量控制则需权衡准确性和 SNP 产量。虽然三种软件在未进行质量控制时填补准确性相近,但选择软件时还需考虑可用性和资源效率。不过,该研究也存在一定局限性,如测序深度可能影响填补准确性,研究结果在其他物种中的通用性也需进一步验证。总体而言,这项研究为 RNA-SNPs 基因分型填补策略提供了有价值的参考,有助于推动基因组和转录组研究的发展,就像为基因研究领域点亮了一盏新的明灯,为后续研究指引了方向。
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》