
-
生物通官微
陪你抓住生命科技
跳动的脉搏
《Nature Genetics》一种结构化溯祖模型揭示现代人类共同的深层祖先结构
【字体: 大 中 小 】 时间:2025年03月19日 来源:Nature Genetics 31.8
编辑推荐:
这项研究通过开发 cobraa 模型,为推断人类祖先结构提供了新的方法。研究结果揭示了现代人类共同的深层祖先结构,即约 150 万年前两个祖先种群分化,约 30 万年前混合,这一结构在人类演化过程中具有重要意义。同时,研究还发现了种群 A 在分化后经历瓶颈效应,以及种群 B 遗传物质受到负选择的证据,这些发现有助于我们更好地理解人类演化的机制。此外,研究人员还发现种群 A 与尼安德特人和丹尼索瓦人的祖先关系,为古人类演化研究提供了新的线索。他们的研究成果发表在《Nature Genetics》杂志上,为人类演化遗传学领域带来了新的突破。
在人类演化的漫长历史长河中,现代人类的起源与发展一直是科学界关注的焦点。随着技术的进步,我们对晚更新世和全新世人类演化遗传学有了更深入的了解,发现过去数万年里人类群体存在反复的分离与混合(即群体混合,admixture)。同时,尼安德特人(Neanderthals)和丹尼索瓦人(Denisovans)的高覆盖基因组研究也表明,古人类与现代人类之间存在基因流动。然而,更古老的群体混合事件是否存在尚不明确,而且以往用于推断有效种群大小变化的成对顺序马尔可夫溯祖(pairwise sequentially Markovian coalescent,PSMC)模型,因其假设种群在演化过程中始终随机交配(panmixia),与已知的祖先种群结构和混合证据相悖,受到了质疑。
为了揭开这些谜团,来自英国剑桥大学遗传学系的研究人员 Trevor Cousins、Aylwyn Scally 和 Richard Durbin 开展了深入研究。他们的研究成果发表在《Nature Genetics》杂志上,为人类演化遗传学领域带来了新的突破。
研究人员面临的主要挑战是如何在复杂的演化背景下,准确推断人类的祖先结构和种群大小变化。以往的研究方法存在局限性,PSMC 模型无法准确反映真实的演化历史,而其他模型在处理古老群体混合事件时也存在不足。因此,研究人员需要开发一种新的方法,以克服这些问题,更准确地揭示人类演化的奥秘。
在这项研究中,研究人员开发了一种基于溯祖的隐马尔可夫模型(hidden Markov model,HMM)——cobraa。该模型在 PSMC 框架的基础上进行改进,明确表示了祖先种群的分裂和重新结合,能够更准确地推断祖先种群结构。同时,研究人员还使用了模拟数据和来自千人基因组计划(1000 Genomes Project,1000GP)、人类基因组多样性计划(Human Genome Diversity Project,HGDP)的真实数据进行分析。通过对这些数据的深入研究,研究人员能够更全面地了解人类的演化历史。
结构化祖先模型的可识别性:研究人员通过分析结构化模型和非结构化(即随机交配)模型的相邻溯祖时间的条件分布,发现即使这两种模型具有相同的溯祖率曲线,它们在条件分布上也存在差异。这表明可以利用这种差异来区分结构化模型和随机交配模型,为 cobraa 模型的应用提供了理论基础。
cobraa 模型推断参数的能力:利用模拟数据,研究人员测试了 cobraa 模型区分祖先结构和随机交配的能力,以及推断结构化模型参数的准确性。结果显示,cobraa 模型能够较好地推断混合比例(γ),即使 γ 低至 5% 也能被大致恢复。在推断种群大小变化和混合时间时,cobraa 模型也比 PSMC 模型更准确地反映了模拟值。
对人类数据的推断:研究人员使用 cobraa 模型对 1000GP 和 HGDP 的数据进行分析,发现结构化模型比连续随机交配模型更能解释数据。通过 cobraa 模型的推断,现代人类是约 150 万年前(Ma)分化的两个种群在约 30 万年前(ka)以约 80:20% 的比例混合的结果。在种群 A 与种群 B 分化后,种群 A 经历了强烈的瓶颈效应,随后种群大小逐渐增加,直到混合事件发生。
推断基因组的混合区域:研究人员扩展了 cobraa 模型,开发了 cobraa - path 模型,用于推断基因组的混合区域。通过对 1000GP 样本的分析,发现来自少数种群(种群 B)的遗传物质在现代人类混合后受到负选择,与编码序列的距离和背景选择强度相关。同时,研究人员还鉴定出与神经元发育和处理相关的基因类别中存在混合富集现象。
与古人类的关系:通过比较现代人类与尼安德特人、丹尼索瓦人的序列差异,研究人员发现尼安德特人和丹尼索瓦人的基因组与主要(种群 A)谱系的分歧更近,表明种群 A 是尼安德特人和丹尼索瓦人的主要祖先种群。
在其他物种中的应用:研究人员还将 cobraa 模型应用于其他物种,如双色蝙蝠(Vespertilio murinus)、普通海豚(Delphinus delphis)、大猩猩(Gorilla beringei graueri)和黑猩猩(Pan troglodytes ellioti)。结果显示,不同物种呈现出不同的推断结果,表明 cobraa 模型在不同物种中具有一定的适用性,但也存在局限性。
这项研究通过开发 cobraa 模型,为推断人类祖先结构提供了新的方法。研究结果揭示了现代人类共同的深层祖先结构,即约 150 万年前两个祖先种群分化,约 30 万年前混合,这一结构在人类演化过程中具有重要意义。同时,研究还发现了种群 A 在分化后经历瓶颈效应,以及种群 B 遗传物质受到负选择的证据,这些发现有助于我们更好地理解人类演化的机制。此外,研究人员还发现种群 A 与尼安德特人和丹尼索瓦人的祖先关系,为古人类演化研究提供了新的线索。
然而,研究也存在一定的局限性。虽然结构化模型比连续随机交配模型更能解释数据,但人类的演化历史可能比模型假设的更为复杂,不能排除多次分裂和混合事件,以及更连续的基因流动。同时,研究中假设基因组中不存在选择,且突变和重组率恒定,这与实际情况不符。未来的研究需要进一步改进模型,考虑更多的因素,以更准确地揭示人类演化的全貌。
总的来说,这项研究为人类演化遗传学领域提供了重要的理论和实践基础,为后续研究开辟了新的方向。通过对人类祖先结构的深入了解,我们能够更好地认识人类的起源和发展,为解决与人类演化相关的各种问题提供有力的支持。
生物通微信公众号
知名企业招聘