编辑推荐:
在药物研发中,治疗靶点识别颇具挑战,尤其是对罕见和孤儿疾病。研究人员开展了 “Therapeutic target prediction for orphan diseases integrating genome-wide and transcriptome-wide association studies” 的研究,通过构建 TRESOR 特征、运用多种机器学习方法,预测了多种疾病的治疗靶点,有望助力罕见病药物研发。
在药物研发的广阔领域中,治疗靶点的精准识别始终是一座难以攻克的 “高山”,尤其是对于那些病因复杂、患者群体稀少的罕见病和孤儿疾病而言,这一挑战更为严峻。传统的靶点预测方法犹如在黑暗中摸索,依赖单一核苷酸多态性(SNP)和转录组数据,犹如盲人摸象,难以精准锁定真正有效的治疗靶点,导致临床试验的成功率大打折扣。而随着罕见病患者群体的逐渐被关注,寻找更高效、准确的治疗靶点预测方法迫在眉睫,这不仅是医学进步的需求,更是无数罕见病患者及其家庭的希望所在。
为了突破这一困境,来自日本九州工业大学计算机科学与系统工程学院生物科学与生物信息学系、名古屋大学信息学研究生院复杂系统科学系以及大分大学医学院呼吸内科和传染病科的研究人员,展开了一项意义非凡的研究。他们的研究成果发表在《Nature Communications》上,为罕见病治疗靶点的预测开辟了新的道路。
研究人员运用了多种关键技术方法。首先,从 L1000 数据库获取靶基因扰动谱(TGPs),并通过张量分解算法填补数据缺失值 。其次,利用 NHGRI-EBI GWAS Catalog 数据库的 GWAS 数据,经 TWAS 分析构建 TRESOR 特征 。再者,从 DisGeNET 下载基因 - 疾病关联(GDAs)和变异 - 疾病关联(VDAs)数据,计算疾病相似性 。最后,综合运用逆签名法、多任务学习法和贝叶斯整合方法预测治疗靶点,并通过 AUC、AUPR 和 BED AUC 等指标评估模型性能。此外,还使用了多个独立样本队列,如来自 The Cancer Genome Atlas(TCGA)的队列、Lung Tissue Research Consortium 的 IPF 队列以及 “Aging, Dementia, and TBI Study” 的创伤性脑损伤(TBI)暴露队列等进行验证。
研究结果主要包括以下几个方面:
- TRESOR 充分反映疾病特异性特征:通过比较 TRESOR 与其他疾病特征(SNP-PV、SNP-eQTL 和 DT)发现,TRESOR 能更好地反映疾病间的相似性。如在国际疾病分类第 11 版(ICD-11)中同属 “VIII. 神经系统疾病” 的阿尔茨海默病、帕金森病和肌萎缩侧索硬化症,以及 “XII. 呼吸系统疾病” 的哮喘和特发性肺纤维化(IPF),使用 TRESOR 时,同类别疾病间的距离更近,表明其能更准确地反映疾病特异性特征。
- 基于 TRESOR 的逆签名法在准确性和适用性上更优:研究对比了基于 TRESOR 的逆签名法与其他基线方法(如基于 DT 的逆签名法、基于 SNP-PV 和 SNP-eQTL 的 SNP 分析方法)在治疗靶点预测方面的性能。结果显示,基于 TRESOR 的逆签名法在预测抑制性和激活性靶点时,AUC、AUPR 和 BED AUC 等指标均优于其他基线方法,且对疾病程度(已知治疗靶点数量)不同的疾病都能保持较高的预测准确性。
- 贝叶斯优化结合逆签名和多任务学习方法提升预测性能:贝叶斯整合方法综合了逆签名法和多任务学习法的优势,在五折交叉验证实验中表现出色。其 AUC、AUPR 和 BED AUC 分数均高于单独使用逆签名法和多任务学习法,对疾病程度高和低的疾病都能准确预测治疗靶点,尤其适用于孤儿疾病,弥补了其他方法的不足。
- 贝叶斯整合方法为罕见病预测有前景的抑制性靶点:利用贝叶斯整合方法,研究人员对 284 种疾病(包括罕见病)的潜在抑制性靶点进行了全面预测。以多发性内分泌肿瘤(MEN)为例,除已知的抑制性靶点 RET 外,还预测出 RASSF5、BECN1 等多个新的候选抑制性靶点。通过基因本体(GO)生物过程和京都基因与基因组百科全书(KEGG)通路分析,验证了这些靶点的作用机制,并且在独立的肿瘤队列(如 TCGA 的肾上腺皮质癌、胰腺癌和甲状腺癌队列)中进一步验证了其有效性。
- 贝叶斯整合方法为疑难疾病预测有前景的激活性靶点:研究人员对 151 种疾病(包括罕见病)的潜在激活性靶点进行预测,以 IPF 为例,除已知的激活性靶点 FFAR1/GPR40 外,预测出 APAF1、STIMATE/TMEM110 等新靶点。GO 和 KEGG 通路分析显示这些靶点可能调节与已知靶点相同或不同的过程,具有潜在的治疗效果。在 IPF 队列中验证了部分靶点(如 STIMATE/TMEM110)与疾病的相关性。
- 贝叶斯整合方法为无已知靶点的孤儿疾病预测有前景的治疗靶点:针对 tauopathies 和视网膜营养不良等无已知治疗靶点的孤儿疾病,研究人员通过贝叶斯整合方法进行预测。在 tauopathies 的预测中,发现 RAB1B 等抑制性靶点和 SNRNP70 等激活性靶点与疾病相关,并在创伤性脑损伤(TBI)暴露队列中得到验证,表明该方法对孤儿疾病治疗靶点预测具有重要价值。
研究结论和讨论部分表明,TRESOR 特征结合多种机器学习方法为罕见病和孤儿疾病治疗靶点预测提供了有效途径。逆签名法利用 TRESOR 能更准确地识别候选靶点;多任务学习法通过疾病相似性引导预测,提高了预测准确性;贝叶斯整合方法结合两者优势,为罕见病和孤儿疾病预测出更可靠的治疗靶点,有助于推动罕见病药物研发的进程。尽管 TRESOR 存在一些局限性,如对 GWAS 数据稀缺的疾病无法进行 TWAS 分析,但随着新的 GWAS 数据不断涌现,这一问题有望得到解决。该研究为罕见病治疗靶点的预测提供了创新的思路和方法,为未来罕见病的精准治疗带来了新的希望,在生命科学和健康医学领域具有重要的意义和应用价值。