在药物发现和开发过程中,药物代谢物的鉴定对于确保药物的安全性和有效性至关重要。传统方法依赖于基本的代谢反应和同位素模式,首先使用质量缺陷过滤(MDF)算法[[1], [2], [3]]进行初步筛选,然后通过串联质谱(MS2)数据分析来确定代谢位点。一些商业软件工具,包括MetaboLynx [2](Waters)和MassHunter(Agilent),可以直接通过相应的质谱(MS)工作站分析收集的代谢物数据。
药物设计的最新进展引入了结构复杂的化合物,这些化合物具有更高的分子量,给代谢物鉴定带来了新的挑战[4,5]。例如,PROTACs通过泛素-蛋白酶体途径介导靶向蛋白质降解[6,7],而LYTACs则通过受体介导的内吞作用促进细胞外和膜蛋白的溶酶体降解[8]。与传统的小分子药物不同,这些化合物通常表现出多个代谢位点、显著的片段丢失以及在质谱中出现双电荷或多电荷物种,这使得注释变得复杂[9,10]。它们复杂的结构经常逃避免受MDF算法的检测,需要手动分析,这既耗时又耗费资源。
分子网络(MN)通过余弦相似性分析MS2光谱,识别结构相关的化合物[[11], [12], [13]]。在此基础上,基于特征的分子网络(FBMN)[14]通过整合色谱对齐和峰强度信息进一步增强了代谢物注释[15,16]。预测工具,如CFM-ID [[17], [18], [19]],可以根据化合物结构生成理论MS2光谱,帮助在缺乏参考光谱时注释未知代谢物。深度学习方法,如MS2DeepScore [20]和Spec2Vec [21],改进了光谱相似性分析,能够更准确地比较片段模式并识别结构多样或新颖的代谢物。
在代谢组学领域,已经开发出多种综合工具来整合基于片段的注释和代谢物检测,例如MS-FINDER [22]、MetaboAnalystR [23,24]和MS-DIAL [25,26]。商业软件,如MassMetaSite(Waters)和Compound Discoverer(Thermo Fisher),结合了紫外和荧光数据或片段离子搜索等功能来进行代谢物验证。MetaboScape(Bruker)将BioTransformer [27,28]和MetFrag [29,30]整合到数据驱动的工作流程中。尽管许多开源工具(如MS-DIAL)支持mzML等通用格式,但一些广泛使用的商业工具(包括MassHunter和MetaboLynx)仍然依赖于供应商特定的格式。
为了解决这些挑战,我们开发了DMetFinder,这是一个用户友好的应用程序,用于全面的药物代谢物分析。DMetFinder结合了余弦相似性评分、同位素模式评估和加合物离子过滤,以提高代谢物鉴定的准确性。通过系统地分析片段离子模式和评估代谢位点及潜在的代谢物结构,它提供了一个详细可靠的注释框架。与传统MDF方法相比,DMetFinder消除了手动筛选和确定代谢位点的需要,同时整合了额外的鉴定策略来提高代谢物注释的准确性。此外,与FBMN不同,它避免了原始数据的复杂预处理,同时保持了准确的代谢物检测。DMetFinder还能自动比较MS2光谱以推断潜在的代谢位点,并通过结合BioTransformer的预测能力,提高了代谢位点分配的可靠性。重要的是,DMetFinder支持本地安装,允许用户输入母体药物结构和LC-MS数据集,实现自动化、高通量的代谢物分析。这一多功能平台为代谢物鉴定提供了高效且易于使用的解决方案,适用于传统的小分子药物以及复杂的新世代化合物,如PROTACs和其他高分子量药物。