编辑推荐:
在天然产物研究中,分子表征系统对解析生物合成途径意义重大。研究人员开发了基于通用参考框架的分子表征系统,以三萜类化合物为研究对象。结果表明该系统能揭示结构变异热点等。这为天然产物研究提供了新视角与方法。
在生命科学的天然产物研究领域,天然产物宛如一座蕴含无限宝藏的神秘矿山,为药物研发、材料创新和农业发展带来了无数灵感。从古老的药用植物到深海的奇异生物,它们产生的天然产物结构复杂多样,是现代科学探索的富矿。然而,目前存在的问题却如同矿山中的重重迷雾,阻碍着人们对这些宝藏的充分挖掘。虽然已经发现了成千上万种天然产物,但许多天然产物的生物合成途径仍然未知,这就好比知道了宝藏的存在,却找不到开启宝藏的钥匙。这种知识的缺失严重限制了天然产物在各个领域的广泛应用。
在众多解析生物合成途径的努力中,核苷酸测序备受关注,就像在黑暗中努力寻找一丝曙光。但与此同时,对天然产物分子结构的分析虽至关重要,却常常被忽视。现有的分子表征系统主要聚焦于药物发现相关任务,在生物合成途径解析方面存在不足。它们大多只能记录分子的连接性和拓扑结构,无法在通用参考框架中确定原子和键的绝对位置,这使得在研究生物合成步骤时困难重重。
为了驱散这些迷雾,来自美国明尼苏达大学德卢斯分校(University of Minnesota Duluth)等多个研究机构的研究人员踏上了探索之旅。他们开展了一项关于构建通用参考框架分子表征系统的研究,旨在为天然产物结构多样性分析和生物合成研究搭建一座桥梁。
研究人员以植物表面蜡质中的三萜类化合物(triterpenoids)为研究对象,精心构建了一个包含 112 种三萜类化合物结构的数据库。他们设计了一种三维网格状模板,将三萜类化合物的骨干原子映射到 x - y 坐标平面上,并为其分配功能基团,同时确定键的方向。通过这种方式,不同的三萜类化合物结构都能以类似电子表格的形式记录下来,便于后续的原子和键的比较分析。
在研究过程中,研究人员运用了多种关键技术方法。首先,利用定性变异指数(Index of Qualitative Variation)和变异比率(Variation Ratio)等多样性指标,对三萜类化合物的原子和键分布进行量化分析。通过计算这些指标,他们能够识别出分子结构中高变异和低变异的区域。其次,运用多对应分析(Multiple Correspondence Analysis)这种类似主成分分析(Principal Component Analysis)但能处理分类参数的方法,来探索整个数据集的结构变异维度。此外,结合系统发育分析(phylogenetic analysis),研究人员将三萜类化合物的分布与植物系统发育树相结合,深入探究它们在不同植物物种中的出现模式以及结构相似性与共现频率之间的关系。
研究结果主要分为以下几个方面:
- 揭示化学结构变异热点:通过计算定性变异指数和变异比率,研究人员发现三萜类化合物在 C 和 D 环顶部的键以及 D 和 E 环的键存在高变异区域,C - 3 和 C - 28 等碳原子位置的取代基也具有较高的变异性。这些高变异区域与已知的生物合成修饰位点相关,如 P450 氧化作用的常见位点。这表明该表征系统能够精准定位分子结构中的变异热点,为深入理解三萜类化合物的结构多样性提供了关键线索。
- 连接层次聚类与生物合成:基于原子对原子的比较,研究人员构建距离矩阵并进行层次聚类分析。结果发现,聚类分析得到的四个主要结构组与三萜类化合物的生物合成过程紧密相关。例如,源自原甾醇阳离子(protosteryl cation)的产物聚集在一个分支中,源自藿烷阳离子(hopanyl cation)和羽扇豆阳离子(lupanyl cation)等的产物也各自聚类。同时,研究人员还分析了每个结构组内的变异特征,进一步揭示了结构变异与生物合成过程中氧化、环化和取代反应的关系。这说明该系统能够反映生物合成过程中的内在联系,帮助研究人员从结构层面推断生物合成途径。
- 展示结构多样性的主要维度:多对应分析显示,三萜类化合物数据集存在两个主要的变异维度。第一个维度将蒲公英烷 / 木栓烷(taraxane/friedelinane)结构组与其他结构组区分开来,第二个维度则将原甾烷(protosteranes)、乌苏烷 / 齐墩果烷(ursane/oleananes)和藿烷 / 羽扇豆烷(lupane/hopanes)结构组彼此分开。通过对分子区域对变异维度贡献的分析,发现蒲公英烷 / 木栓烷结构组的变异主要源于阳离子迁移导致的骨架立体化学结构变化,这进一步强调了该结构组在整个数据集结构多样性中的重要贡献。
- 揭示生物合成规律:将三萜类化合物映射到植物系统发育树上,并对其共现模式进行分析。研究发现,许多结构相似的化合物倾向于在同一物种中共同出现,但也有一些结构差异较大的化合物共现频率高于预期。进一步分析原子和键的共现情况,确定了一些在不同结构组化合物中频繁共现的原子 / 键组合,这些组合与特定的生物合成酶活性相关,如 P450 氧化酶或短链脱氢酶 / 还原酶(SDR)的活性。这表明该系统能够在系统发育背景下揭示生物合成的规律,为研究多步骤生物合成途径和酶的底物特异性提供了新的视角。
在结论和讨论部分,研究人员开发的通用参考框架分子表征系统展现出了巨大的潜力。它能够直接测量分子骨架立体化学和连接化学基团的变化,揭示分子结构中高度可变或高度保守的位置。通过支持层次聚类分析,不仅能够识别主要的结构组,还能深入比较组内分子在原子、化学基团和键层面的异同。该系统与多对应分析等工具的结合,帮助研究人员发现了与氧化角鲨烯环化过程相关的结构变异模式。此外,结合化合物在物种中的分布数据,研究人员深入了解了生物合成过程,包括基因复制和新功能化、多功能酶形成不同分子以及单一酶或酶类型对多种化合物的相似转化等情况。
然而,该系统目前也存在一些局限性。它可能仅适用于来自相似起始材料的化合物,以便创建通用模板。而且将分子添加到系统中的过程目前需要手动操作,较为耗时。但尽管如此,这项研究为未来开发更高效的分子表征系统奠定了基础,尤其是那些能够利用现有化学数据库实现部分或完全自动化的系统。总的来说,这项研究成果发表在《Plant Communications》上,为天然产物结构多样性和生物合成研究提供了全新的思路和方法,开启了深入探索天然产物奥秘的新征程,有望推动生命科学和健康医学领域在天然产物研究方面取得更多突破。