人工智能与网络药理学助力癌症研究:探寻 RALGDS 突变相关的生物标志物与治疗靶点

【字体: 时间:2025年03月30日 来源:Scientific Reports 3.8

编辑推荐:

  本文利用人工智能(AI)和网络药理学研究 KRAS 相关基因。通过分析多种数据,发现 RALGDS 蛋白是与 KRAS 相关的潜在生物标志物。研究设计并验证了针对 RALGDS 的分子,为癌症诊断和治疗策略的开发提供了新方向。

  ### 研究背景
在癌症研究领域,KRAS(Kirsten Rat Sarcoma Viral Oncogene Homologue)基因作为最常发生突变的致癌基因之一,与多种恶性肿瘤的发生发展密切相关,像非小细胞肺癌(NSCLC)、胰腺导管腺癌(PDAC)、结直肠癌(CRC)等。虽然针对其他基因突变(如 EGFR、ALK 基因融合)的靶向治疗取得了进展,但 KRAS 突变相关癌症的治疗仍面临诸多挑战,有效治疗手段有限。
近年来,RALGDS(RAL guanine nucleotide dissociation stimulator)作为 KRAS 信号通路的关键下游效应器,受到了广泛关注。它在促进细胞增殖、支持细胞周期进展方面发挥着重要作用,其活性与肿瘤生长和转移密切相关,因此成为潜在的癌症治疗靶点。本研究旨在利用人工智能和网络药理学,深入挖掘与 KRAS 相关基因的潜在生物标志物,开发针对 KRAS 突变癌症的诊断和治疗新策略。

材料和方法


  1. 基因组分析:从 CBioPortal Cancer Genomics 数据库收集并筛选 KRAS 相关基因数据,全面分析患者的基因改变情况,包括突变扩增、深度缺失、多种改变以及不同类型癌症中的基因变化。同时预测拷贝数改变、意义不明的剪接变异和框内突变。借助 reactome 途径对 KRAS 相关基因进行通路分析,该方法通过优化数据结构,提升了处理大规模组学数据的性能,从而更准确地识别基因通路。
  2. 蛋白质组学 AI 和多组学分析:多组学整合应用多种高通量筛选技术,如基因组学、转录组学、单细胞转录组学、蛋白质组学、代谢组学和空间转录组学。通过公式对不同组学数据集进行加权整合,以优化预测准确性。利用基于网格的聚类算法和以蛋白质网络相互作用为中心的 AI 数据库(如 STRING),分析蛋白质 - 蛋白质相互作用,确定关键蛋白和潜在治疗靶点。通过 Metascape 软件进行基因富集分析,研究与特定蛋白质、组织和基因本体蛋白结构域相关的生物学过程和分子活动。
  3. RALGDS 先导设计与构建:运用 Schrodinger Maestro 软件包(Version 13.9.132)对 RALGDS 蛋白进行研究。首先对蛋白进行预处理,调整氢原子、分配键序,利用 Epik 生成杂原子状态,通过 PROPKA 算法优化结构。使用橡皮擦算法进行位点映射检测,确定配体结合口袋,生成受体网格。基于蛋白质的药效团建模设计和构建配体,设定相关参数进行配体对接。
  4. MD 模拟研究:对最佳对接结果和 MMGBSA 结果进行分子动力学(MD)模拟,进一步确认蛋白质 - 配体复合物的稳定性。对复合物进行溶剂化处理,添加离子中和系统。设定模拟时间为 100 ns,记录轨迹,分析总能量(TE)、势能(PE)、温度(T)、压力(P)和体积(V)等参数。通过计算均方根偏差(RMSD)和均方根波动(RMSF),观察蛋白质 - 配体复合物的稳定性和氨基酸相互作用。
  5. ADMET 预测:采用基于图的特征方法对化合物进行吸收、分布、代谢、排泄和毒性(ADMET)预测。输入先导化合物的规范形式,综合考虑亲脂性、极性、分子量、饱和度、不溶性等参数,评估化合物的药代动力学性质、生物利用度、药物相似性、是否符合 Lipinski 规则五以及毒性等,为筛选有潜力的药物候选物提供依据。

结果与讨论


  1. 基因组分析:基因组分析显示,KRAS 突变是最常见的基因改变,其次是扩增,这些改变在胰腺癌中尤为突出。KRAS 基因与约 40 种癌症相关,其中二倍体 KRAS 基因的错义驱动突变最为常见,与癌症发展密切相关,可能成为癌症治疗的潜在靶点。虽然扩增和深度缺失相对较少见,但它们在癌症进展中也起着重要作用。

胰腺导管腺癌(PDA)的发展是一个逐步的过程,涉及多个基因的异常改变。早期 HER - 2/neu(ERBB2)基因过表达,随后 K - RAS 基因发生触发点突变;中期 p16 基因(CDKN2A)失活;晚期 p53、SMAD4 和 BRCA2 等关键基因失活。此外,PDA 还存在基因组不稳定和非整倍体现象,这些变化与肿瘤的发生和发展密切相关。

结直肠癌(CRC)的发生与染色体不稳定性(CIN)和微卫星不稳定性(MSI)两种机制有关。CIN 导致 K - ras 等癌基因激活和 p53、DCC/Smad4、APC 等肿瘤抑制基因失活;MSI 则由 DNA 错配修复基因 MLH1 或 MSH2 启动子高甲基化和编码微卫星基因的小突变引起。此外,CRC 还存在一些遗传性综合征,如家族性腺瘤性息肉病(FAP)和遗传性非息肉病性结直肠癌(HNPCC),分别与 APC 基因和 DNA 错配修复基因突变有关。KRAS 突变在 CRC 中的作用受突变顺序影响,且是预测对 EGFR 抑制药物反应的重要指标。
2. 蛋白质组学 AI 和多组学分析:将 AI 融入网络药理学,通过深度可解释网络关系推断框架,具有可解释特征学习和扩展特征空间的优势,有助于克服 AI 模型在生物网络中的局限性。借助 Strings db 数据库进行 AI 蛋白质组学分析,发现 KRAS 基因与 RALGDS 基因在蛋白质 - 蛋白质相互作用网络中具有较高的节点和紧密性。通过基因重叠、热图和蛋白质富集分析,进一步验证了 RALGDS 在 KRAS 信号通路中的关键作用。

多组学分析对匹配蛋白质的五个主要成分(分子功能、组织基因、蛋白质结构域、疾病相关 KEGG 通路)进行研究,发现多个与癌症相关的关键蛋白和通路。例如,在分子功能富集分析中,阴离子结合、嘌呤核糖核苷三磷酸结合和嘌呤核苷酸结合等成分包含多种与癌症相关的蛋白;组织富集分析显示肺癌、胰腺癌和结直肠癌与 KRAS 等蛋白密切相关;蛋白质结构域富集分析突出了 P - 环含核苷三磷酸水解酶结构域的重要性;KEGG 通路分析揭示了 Rap1 信号、MAPK1 信号和多种癌症信号通路的关键作用;疾病富集分析表明与癌症相关的基因数量显著增加。
3. RALGDS 先导设计与构建:对 Alpha fold 蛋白 AF - Q12967 进行结合口袋分析,确定其具有结合有机化合物的能力。基于药效团模型设计并分析一系列分子,筛选出三种先导化合物。其中一种先导化合物的辛基芳香环系统与 RALGDS 蛋白结合腔匹配良好,对接分数和 MMGBSA 结合能计算值为 - 53.53 kcal/mol。该化合物与蛋白形成氢键、疏水相互作用、极性相互作用和正电荷相互作用,这些相互作用有助于稳定结合。
4. MD 模拟研究:MD 模拟结果显示,模拟过程中体积、压力、温度、势能和总能量等参数稳定,表明模拟结果可靠。蛋白质 - 配体复合物的 RMSD 波动在 1 - 2 埃范围内,比单独的蛋白质更稳定;RMSF 分析表明复合物的波动较小。从模拟的 400 - 700 帧,配体与蛋白之间形成了稳定的相互作用,主要包括 π - π 堆积相互作用和氢键相互作用,涉及多个活性氨基酸。热图分析显示配体与蛋白之间存在显著相互作用,超过 20 个氨基酸的相互作用在整个模拟过程中保持稳定,证明了新设计的辛基芳香环系统在 RALGDS 蛋白口袋中的稳定结合。
5. ADMET 预测:利用 PKCSM 数据库对三种先导化合物进行 ADMET 预测,比较它们在吸收、分布、代谢、排泄和毒性方面的特性。结果表明,三种先导化合物在水溶性、Caco2 通透性、肠道吸收和皮肤通透性等吸收特性上相似,但在与 P - 糖蛋白的相互作用、细胞色素 P450 酶的底物和抑制剂特性、总清除率、肾 OCT2 底物可能性以及分布和毒性方面存在差异。例如,Lead 2 具有良好的吸收能力,且对细胞色素 P450 酶无抑制作用;Lead 1 具有双重底物活性和广泛的抑制谱;Lead 3 在 P - 糖蛋白底物和抑制剂特性方面表现突出。

结论


本研究运用人工智能驱动的网络生物学方法,结合基因组学数据和综合遗传数据集,开发了创新的药物发现方法。通过深入的基因分析,发现 RALGDS 蛋白是与 KRAS 相关的有前景的生物标志物。基于 RALGDS 蛋白建模,利用橡皮擦算法确定最佳结合腔,设计并验证了针对 RALGDS 的分子。MD 模拟证实了蛋白质 - 先导化合物复合物的稳定性,ADMET 预测为进一步开发提供了有价值的信息。这些研究结果为癌症诊断和治疗策略的改进提供了新的方向,有望推动 KRAS 突变相关癌症治疗的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号