编辑推荐:
本研究针对孤儿溶质载体蛋白(SLC)底物未知的问题,开发预测算法,利用癌症多组学数据挖掘SLC表达与细胞内代谢物浓度的相关性,成功恢复已知SLC-底物对,并预测新的SLC-药物相互作用,为去孤儿化SLC、理解其生理病理角色提供新机遇。
溶质载体蛋白(SLC)是人体内一类重要的膜转运蛋白,负责运输多种代谢物、信号分子和药物穿过细胞膜,在细胞代谢、信号传导及药物动力学中发挥关键作用。然而,约三分之一的SLC蛋白是“孤儿”,其底物尚未明确,这限制了对它们生理功能和病理角色的理解。为解决这一问题,国外研究团队开发了一种基于多组学数据的预测算法,利用现有的癌症多组学数据集,分析SLC表达水平与细胞内代谢物浓度之间的相关性,以预测孤儿SLC的潜在底物。
该研究发表在《BMC Genomics》上,研究人员来自英国牛津大学生物化学系等机构。他们首先利用癌症细胞系百科全书2019(CCLE2019)中的数据,对447个SLC和72个SLC样基因进行分析,计算其与225种代谢物之间的斯皮尔曼秩相关系数(ρ),并转换为Z分数以考虑不同代谢物之间的相关性强度差异。结果发现,许多SLC的表达与其已知底物的代谢物浓度相关性最强,例如SLC6A6与β-丙氨酸和牛磺酸的相关性最强,SLC6A8与肌酸及其衍生物(磷酸肌酸和肌酐)的相关性较强,表明该方法在恢复已知SLC-底物对方面具有较高的敏感性和特异性。
为提高预测性能,研究人员进一步整合了CRISPR-Cas9依赖性筛选数据和代谢途径邻接性数据。通过CRISPR-Cas9筛选,分析细胞生长对特定SLC的依赖性,发现细胞生长依赖于特定SLC时,其代谢物浓度在依赖和非依赖细胞系之间存在显著差异,这些代谢物可能是该SLC的候选底物。代谢途径邻接性分析则基于KEGG代谢途径,构建代谢物邻接矩阵,考虑SLC与其底物衍生物之间的相关性,发现与底物相邻的代谢物(即转化步骤较少的衍生物)与SLC的相关性更强,而与非相邻代谢物的相关性则更接近随机水平。这些改进显著提高了预测算法的性能,使已知SLC-底物对的平均置信度得分显著高于随机对,且在不同置信度得分截止值下,已知对的恢复比例也显著高于随机对。
基于以上方法,研究人员为128个孤儿SLC生成了高置信度的底物预测列表,并发现一些预测结果与已有实验数据一致。例如,预测孤儿SLC CLN3与多种甘油磷酸相关代谢物相关,与CLN3突变导致甘油磷酸二酯积累的研究结果相符;预测MTCH1与谷胱甘肽合成相关代谢物相关,与MTCH1缺陷导致线粒体NAD?耗竭的观察结果一致。此外,研究还预测了SLC与细胞毒性药物之间的新相互作用,利用癌症药物重定位筛选数据,分析SLC表达对药物疗效的影响,发现SLC35F2表达增强细胞对药物YM-155的敏感性,而SLC19A2表达对硫胺素的细胞毒性无影响。通过对比已知SLC-药物相互作用与随机对,验证了该方法在预测SLC-药物相互作用方面的有效性。
该研究开发的预测算法为去孤儿化SLC提供了新的生物信息学工具,有助于深入理解SLC在健康和疾病中的作用,为药物研发和个性化医疗提供了潜在的新靶点和思路。尽管该方法在预测SLC底物方面表现出较高的准确性,但也存在一些局限性,如依赖于现有的多组学数据集,可能受到癌症细胞系代谢重编程的影响,且无法涵盖所有可能的代谢物和离子底物。未来的研究可以进一步优化算法,结合更多的实验验证,以提高预测的准确性和可靠性,并探索SLC在其他生理病理过程中的功能。