
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于5000例中国人群外显子组测序解析遗传负荷的群体差异与适应性进化特征
【字体: 大 中 小 】 时间:2025年08月31日 来源:Journal of Genetics and Genomics 7.1
编辑推荐:
本研究通过分析5002例中国人群外显子组数据,系统评估了汉族亚群和少数民族的遗传负荷特征。研究发现93.4%的ClinVar致病/可能致病(P/LP)变异为超罕见变异,揭示了G-Han与壮族群体的遗传亲和性,鉴定了MTHFR rs1801133-A等适应性变异的地理梯度分布,并发现S-Han中PRPF4/TUB基因罕见变异与视网膜色素变性风险相关。该研究为中国的精准医疗提供了群体特异性遗传风险框架。
随着高通量测序技术的发展,人类基因组研究已进入深度解析阶段。遗传负荷(genetic load)理论作为分子进化研究的核心框架之一,量化了有害突变对群体适应度的累积影响。然而,中国作为全球最大且遗传多样性最丰富的群体之一,其遗传负荷的系统评估仍存在显著空白。传统研究多聚焦于欧洲人群,而中国复杂的 demographic history(群体历史)和地理环境差异如何塑造遗传风险图谱尚不明确。这导致临床基因组学在中国应用时面临"参考基因组偏差"的挑战,特别是在罕见病诊断和携带者筛查领域。
针对这一关键问题,复旦大学徐书华(Shuhua Xu)团队在《Journal of Genetics and Genomics》发表了突破性研究。研究人员利用"华表计划"(HuaBiao Project)的5002例高深度外显子组数据(中位深度73.7×),涵盖北方汉族(N-Han)、南方汉族(S-Han)、广西汉族(G-Han)三大亚群及13个少数民族,首次绘制了中国人群遗传负荷的全景图谱。研究创新性地整合了群体遗传学、临床遗传学和进化生物学多维证据,为理解中国人群的遗传疾病风险提供了新范式。
关键技术方法包括:1) 基于BWA-GATK流程的变异检测与严格质控;2) 使用CADD>15和GERP RS>2标准定义有害变异;3) 结合ClinVar数据库筛选致病/可能致病(P/LP)变异;4) 采用主成分分析(PCA)和FST计算解析群体结构;5) 应用基因聚集分析(gene-based collapsing analysis)检测罕见变异负荷;6) 通过LSBL(Long-term Site Branch Length)和XP-EHH(Cross Population Extended Haplotype Homozygosity)方法鉴定选择信号。
遗传架构解析
PCA分析揭示G-Han与壮族群体存在显著遗传亲和性,而N-Han与S-Han形成紧密聚类。全外显子组共鉴定161万高质量SNV,其中90.06%为罕见变异(DAF<0.01),52.12%为dbSNP未收录新变异。TTN基因以人均0.30个有害单体型(singleton)成为突变负荷最高基因。
个体遗传负荷特征
中国个体平均携带8465.56个近固定衍生SNV(DAF>0.999),其中9.5%(5014个)为有害变异。GERP 4-6区间的中度有害变异贡献了84.98%的加性遗传负荷。值得注意的是,人均携带67.48个有害单体型,反映近期人口扩张导致的选择延迟效应。
群体分化模式
藏族个体有害变异负荷最高(5080.7个),显著高于壮族(4987.6个)。汉族亚群中,N-Han的杂合变异最多,而G-Han有害单体型数量减少36.7%。ClinVar P/LP变异93.4%为超罕见变异,但GJB2 rs72474224-A(听力损失)在壮族和G-Han中频率显著升高(0.20 vs 0.15)。
医学相关发现
ACMG次要发现基因中,LDLR变异携带者占比最高(24例),且在汉族亚群间分布均衡。β-地中海贫血相关HBB变异(rs33986703-A/rs33950507-T)在G-Han中富集(DAF~0.01)。基因聚集分析发现S-Han中PRPF4(3.7% vs 0.7%, P=4.23×10-6)和TUB(2.6% vs 0.3%, P=1.34×10-5)与视网膜色素变性风险相关。
适应性进化特征
MTHFR rs1801133-A呈现从北向南的频率递减(N-Han:0.636→G-Han:0.205),符合UV-叶酸代谢适应假说。相反,ALDH2 rs671-A(酒精代谢)显示反向梯度(G-Han:0.259→N-Han:0.116)。G-Han特有的ABCC11 rs17822931-A(LSBL=0.335)可能与热带适应相关。
这项研究通过多维度证据链揭示:中国人群的遗传负荷受群体历史、地理隔离和区域适应的共同塑造。其创新价值体现在三方面:1) 建立中国特异性变异频率数据库,填补了东亚精准医疗的空白;2) 发现G-Han作为遗传"过渡群体"的独特地位,为理解汉族形成史提供新视角;3) 鉴定了PRPF4/TUB等具有临床意义的群体特异性风险基因。研究结果对发展中国人群的携带者筛查策略和疾病风险预测模型具有重要指导意义,特别是针对β-地中海贫血、心血管疾病等区域性高发疾病。未来需要扩大少数民族样本量,并整合表型数据以增强临床转化价值。
生物通微信公众号
知名企业招聘