基于高斯图形最优传输揭示疾病进展中的关键转变和分子机制:为精准医学开辟新道路

《Communications Biology》:Uncovering critical transitions and molecule mechanisms in disease progressions using Gaussian graphical optimal transport

【字体: 时间:2025年04月07日 来源:Communications Biology 5.2

编辑推荐:

  为解决疾病进展研究中数据高维、样本难对齐等问题,研究人员开展了基于高斯图形最优传输(GGOT)分析疾病进展的研究。结果显示,GGOT 能有效检测关键转变、识别触发分子,在多种疾病数据集上表现优异,为精准医学和理解疾病机制提供了有力工具。

  在生命科学领域,疾病的发生和发展就像一部复杂的 “悬疑剧”,充满了未知与挑战。疾病进展过程中,关键转变(critical transitions)的发生难以预测,就像隐藏在迷雾中的神秘关卡,而触发这些转变的分子更是如同神秘的 “幕后黑手”,难以捉摸。随着高 - throughput 测序技术的发展,基因表达数据虽提供了海量信息,但数据的高维性以及不同疾病阶段样本难以对齐等问题,使得从这些数据中挖掘关键信息困难重重。现有的检测关键转变的方法,有的仅基于理论探索,在实际复杂疾病场景中难以应用;有的虽在某些方面取得进展,但面对异质性或急性疾病时仍存在局限性。因此,迫切需要一种新的系统性方法,能够有效识别不同疾病数据集的关键转变,深入研究局部触发因素,并实现可视化和样本水平的预测,从而为疾病的早期诊断和干预提供有力支持。
为了攻克这些难题,西安交通大学的研究人员开展了一项重要研究。他们提出了高斯图形最优传输(Gaussian Graphical Optimal Transport,GGOT)这一计算框架,用于分析疾病进展。该研究成果发表在《Communications Biology》上,为生命科学和医学领域带来了新的曙光。

研究人员在开展此项研究时,运用了多个关键技术方法。首先是高斯图形模型(Gaussian Graphical Models,GGM),它通过高斯分布来表示变量间的条件依赖关系,能够有效描述基因相互作用网络。其次是最优传输(Optimal Transport,OT)理论,其引入的 Wasserstein 距离可衡量分布间的差异,为检测疾病关键转变提供了有力工具。研究使用了来自多个公开数据库(如 GEO、TCGA)以及自主收集的疾病数据集,涵盖多种疾病,通过对这些数据进行处理和分析,实现研究目的。

下面来详细看看研究结果:

  1. GGOT 模型概述:GGOT 结合 GGM 和 OT,具有独特优势。它利用嵌入蛋白质相互作用(PPI)网络领域先验知识的 GGM 描述基因相互作用网络,构建不同疾病阶段的高斯分布,减少无关变量影响,增强模型可解释性;通过计算从正常到异常阶段的全局 Wasserstein 距离(GWD),检测疾病关键转变;基于最优传输分解的局部 Wasserstein 距离(LWD)识别触发分子,并开发下游分析工具,预测未知样本疾病状态,可视化疾病进展过程。
  2. GGOT 对模拟数据的验证:研究人员基于具有十六个节点的基因调控网络进行数值模拟。结果显示,随着系统接近临界点,GWD 分数突然增加,预示关键转变的到来;某些节点(触发分子)的 LWD 分数在接近临界点时急剧上升,而其他节点则保持较低水平,证明 GGOT 能准确识别触发分子,且分布传输过程也符合预期,验证了 GGOT 在模拟数据中的可靠性和准确性。
  3. GGOT 检测疾病进展中的关键转变:将 GGOT 应用于多个真实世界数据集,涵盖慢性和急性疾病。在非酒精性脂肪肝病(NAFLD)、肺损伤、肺癌(LUAD)和败血症(Sepsis)等疾病中,GGOT 均能有效识别关键转变的阶段。例如在 NAFLD 中,检测到 “steatosis” 阶段为关键转变点,此阶段后肝脏损伤出现不可逆变化;在肺癌中,识别出 IIIB 阶段为关键转变点,患者在此阶段后疾病恶化,生存率降低。这些结果表明 GGOT 能在不同疾病中识别关键转变,帮助医生提前预警,为早期干预提供依据。
  4. GGOT 识别触发分子揭示疾病进展机制:通过分解 GWD 分数得到 LWD 分数,GGOT 可识别不同疾病中的触发分子。在不同疾病中,特定分子在关键转变点附近 LWD 分数显著增加。对这些触发分子进行功能和生存分析发现,它们参与了疾病相关的重要生物过程。如在 NAFLD 中,触发分子参与趋化、白细胞迁移等过程;在肺癌中,某些触发分子与肿瘤侵袭和转移相关。这些结果有助于深入理解疾病进展机制,为开发靶向治疗提供潜在靶点。
  5. GGOT 预测样本阶段分布:GGOT 构建的疾病阶段高斯图形模型有助于预测未知样本的阶段分布。通过 leave-one-out 交叉验证计算预测准确率,在多数数据集上样本预测准确率超过 0.85,F1 分数超过 0.9。虽然在某些疾病(如 LUAD)中,临界点后的样本预测存在误判,但 GGOT 仍能通过判断患者是否经历不可逆转变,为个性化诊断和治疗提供帮助。
  6. GGOT 可视化阶段传输过程:GGOT 利用主成分分析(PCA)可视化疾病进展阶段的传输过程。结果显示,疾病分布在远离临界点时较为集中,接近临界点时逐渐分散,不同疾病的分布变化与疾病进展速率相关。如急性进展性疾病的状态转变幅度高于慢性进展性疾病。这一结果有助于直观理解疾病进展轨迹和不可逆变化,为疾病研究提供了新视角。
  7. GGOT 与现有方法的比较:将 GGOT 与六种现有方法对比,结果表明 GGOT 在检测关键转变方面表现更优。在多个疾病数据集上,GGOT 的关键转变特异性指数(CSI)、香农熵指数(SEI)和 p 值等指标表现更好,尤其在急性进展性疾病(如 Sepsis)中优势明显。此外,融入 PPI 网络的 GGOT 在识别关键转变方面表现更出色,进一步验证了其有效性。

研究结论和讨论部分强调了 GGOT 的重要意义。GGOT 能够有效检测不同类型疾病的关键转变,识别触发分子,预测样本阶段分布,可视化疾病进展过程。与现有方法相比,它具有更强的鲁棒性和稳定性,无需参数调整,在不同噪声数据集上均表现良好。GGOT 为疾病进展研究提供了一个通用框架,可整合多种生物分子关联网络,有助于深入理解疾病进展和分子调控机制,为疾病的病理分析和个性化精准医疗做出重要贡献。不过,研究也存在一些局限性,如未充分考虑疾病变化的连续过程和突变、亚型的影响,未来可在这些方面进一步改进和研究。总的来说,GGOT 为生命科学和医学领域在疾病研究方面提供了创新的思路和强大的工具,有望推动精准医学的发展,为人类健康带来新的希望。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号