-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于泛基因组图谱校正中国地方猪种杂合度高估现象:映射偏倚的量化分析与解决方案
《BMC Biology》:Pangenome graph mitigates heterozygosity overestimation from mapping bias: a case study in Chinese indigenous pigs
【字体: 大 中 小 】 时间:2025年03月27日 来源:BMC Biology 4.4
编辑推荐:
针对猪参考基因组Sscrofa11.1在中国地方猪种研究中存在的映射偏倚问题,上海交通大学农业与生物学院团队构建了包含10个猪品种的泛基因组图谱。研究发现该图谱可降低1.4%假阳性映射和0.8%错误映射,显著提升SNP(F1:0.9660)和INDEL(F1:0.9226)分型准确性,并首次量化证实线性参考基因组会导致杂合度(Ho)和核苷酸多样性(π)的高估。该成果为畜禽遗传资源评估提供了更精准的分析工具,发表于《BMC Biology》。
在中国丰富的畜禽遗传资源宝库中,地方猪种因其独特的性状和悠久的驯化历史而备受关注。然而长期以来,基于欧洲杜洛克猪构建的参考基因组Sscrofa11.1在中国地方猪种研究中暴露出明显的局限性——遗传距离导致的映射偏倚(mapping bias)可能扭曲真实的遗传变异图谱。这种系统性误差如何量化?又该如何解决?上海交通大学农业与生物学院潘玉春、王震团队在《BMC Biology》发表的研究给出了创新性答案。
研究团队采用多组学技术路线:首先基于10个猪品种(含7个中国地方猪种)的组装序列构建泛基因组图谱;通过模拟测序(mason2)和真实测序数据(28头梅山猪WGS,平均23×覆盖度)评估映射性能;使用VG Giraffe进行图基因组比对;采用GATK4 HaplotypeCaller进行变异检测;并整合ATAC-seq和ChIP-seq(H3K27ac/H3K4me3)表观组数据分析。
构建图基因组体系
研究构建了四类梅山猪定制图基因组(SNP-graph/SHORT-graph/SV-graph/ALL-graph)和泛基因组图谱。系统发育分析显示Sscrofa11.1与中国猪种存在显著分化。泛基因组包含30,086,854 SNPs和721,192复杂变异,新增42,061,158条非参考序列(NRSs)。
映射准确性提升
模拟数据显示泛基因组映射准确率达95.81%,较Sscrofa11.1-linear提升1.77%。在重复区域改善更显著(+2.27%)。分析揭示线性参考基因组存在4.35%假阳性映射,而泛基因组通过纳入结构变异(SVs)有效降低错误定位。
分型性能优化
泛基因组使SNP分型F1值提升至0.9660(线性基因组0.9607),INDEL分型达0.9226。特别值得注意的是,线性基因组导致的基因型不一致区域(如chr2:50-72Mb)与65%的肉质性状QTLs显著重叠,提示既往研究可能存在系统性偏差。
杂合度高估现象
对19头梅山猪的真实数据分析发现,线性基因组导致的差异SNPs中,6.17%呈现观察杂合度(Ho)高估,6.3%显示核苷酸多样性(π)虚高。这一现象在鸡泛基因组比较中同样得到验证,证实了跨物种的参考偏倚共性。
表观组数据一致性
ATAC-seq和ChIP-seq分析显示97.81-99.54%的峰在两种基因组间无显著差异,但线性基因组特异性峰更多集中于未定位contigs,反映复杂区域的映射不确定性。
这项研究首次量化了猪参考基因组在中国地方猪种研究中的映射偏倚程度,证实泛基因组可有效校正杂合度高估现象。其创新性体现在:①建立首个整合中国猪种多样性的泛基因组图谱;②开发适用于畜禽的图基因组分析流程;③揭示参考偏倚对重要经济性状QTL定位的影响。该成果不仅为猪遗传育种提供更精准的分析工具,其方法论对其它农业动物研究也具有重要借鉴意义。随着长读长测序成本下降,未来基于品种特异组装构建的定制化图基因组有望进一步突破现有技术瓶颈。
知名企业招聘
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号