编辑推荐:
在探索趋同性状遗传基础时,现有研究面临结果不一致、缺乏定量模型等问题。研究人员开展了 “Evolutionary sparse learning reveals the shared genetic basis of convergent traits” 主题研究,运用 ESL - PSC 方法,发现趋同性状存在显著遗传共性,为揭示性状趋同遗传基础提供新途径。
在自然界中,不同物种常常会在相似的环境压力下,进化出近乎相同的性状,这一神奇的现象被称为趋同进化。比如,蝙蝠和齿鲸都进化出了回声定位能力,以适应特殊的生存环境;许多草本植物则独立演化出了 C
4光合作用途径,来提高对二氧化碳的利用效率。这些趋同进化的例子,为科学家们探索生命演化的遗传机制提供了宝贵的研究素材。
然而,长期以来,科学家们在探寻趋同性状的遗传基础时,却面临着诸多难题。一方面,不同研究的结果常常相互矛盾,难以确定趋同性状到底在多大程度上是由相似的遗传和分子途径演化而来的。例如,在对回声定位能力的研究中,虽然有研究发现了一些与声音感知相关基因的富集现象,但其他研究却未能重复出这一结果,使得趋同性状遗传基础的存在性和稳定性受到质疑。另一方面,现有的研究方法大多只能回顾性地分析数据,无法建立定量的遗传模型,来预测趋同性状的出现与否,这极大地限制了我们对趋同进化遗传机制的深入理解。
为了解开这些谜团,来自美国天普大学(Temple University)等机构的研究人员开展了一项极具创新性的研究。他们运用进化稀疏学习与配对物种对比(ESL - PSC)的方法,构建了趋同性状进化的遗传模型,旨在揭示趋同性状背后的共同遗传基础。该研究成果发表在《Nature Communications》上,为我们理解生命演化的遗传密码带来了新的曙光。
在研究方法上,研究人员主要运用了以下关键技术:首先是基因组比对数据的检索与处理,从相关数据库获取叶绿体基因和哺乳动物蛋白质序列的比对数据,并进行翻译和编码处理;其次是通过特定的标准选择对比对,确保对比对的物种来自进化独立的分支;然后利用最小绝对收缩和选择算子(LASSO)逻辑回归构建遗传模型,并通过估计模型拟合分数(MFS)选择最佳模型;最后,对模型进行本体分析和构建空遗传模型进行验证。
研究结果主要分为以下几个方面:
- ESL - PSC 构建趋同性状遗传模型:ESL - PSC 通过选择平衡的输入数据集,构建遗传模型来预测性状阳性和阴性物种。在构建模型时,对氨基酸位置和基因施加惩罚,使模型仅纳入对分类物种性状有显著贡献的蛋白质,有效排除了因共同祖先导致的序列相关性干扰。
- C4光合作用趋同获得的遗传模型:研究人员利用 ESL - PSC 对 64 种草本植物的 67 种叶绿体蛋白进行分析,构建了 C4光合作用进化的遗传模型。该模型准确预测了未用于模型构建的 C4和 C3物种的性状,表明许多相同的替换对 C4光合作用的独立获得有贡献。去除 RuBisCo 构建的模型仍有较高预测准确性,说明其他叶绿体蛋白在 C4进化中也发挥了重要作用。
- 回声定位的趋同进化:研究人员以小棕蝠和宽吻海豚为回声定位阳性物种,选择非回声定位的姐妹物种作为对照,分析了 14,509 种蛋白质比对数据。结果发现,ESL - PSC 鉴定出的与回声定位相关的基因,高度富集在与听觉感知相关的功能类别中,且在合成数据集测试中表现优异,优于其他方法。
- 与其他方法的比较:研究人员将 ESL - PSC 与六种现有方法进行对比,结果显示 ESL - PSC 在检测与回声定位相关的基因富集方面表现更优,且运行时间更短。同时,通过对进化速率、预测能力等方面的分析,进一步证明了 ESL - PSC 结果的可靠性和优越性。
- 性状预测测试功能假设:研究人员利用 ESL - PSC 的预测建模能力,对富集的蛋白质类别进行功能验证。结果表明,与听觉相关的蛋白质类别在预测物种回声定位性状时准确性更高,而非听觉相关的富集可能是由非共享的中性背景收敛导致的假阳性。
研究结论和讨论部分指出,ESL - PSC 方法为研究趋同性状的遗传基础提供了一种强大的工具。它不仅能够准确预测趋同性状的出现,还能揭示出潜在的遗传机制,克服了传统分子进化方法的局限性。此外,ESL - PSC 能够在少量样本的情况下有效检测趋同性状的遗传基础,符合少样本学习的范式,为研究趋同进化提供了新的思路和方法。这一研究成果对于深入理解生命演化的遗传机制具有重要意义,有望推动功能基因组学和进化生物学领域的进一步发展,也为后续研究提供了有价值的参考,有助于科学家们更深入地探索物种适应环境的遗传奥秘。