基于可解释性QSAR模型揭示4-芳基-2-肼基噻唑衍生物抗白色念珠菌活性的分子机制
《Molecular Diversity》:Interpretable Quantitative Structure–Activity Relationship (QSAR) for identification of potent antifungal activity agents towards Candida albicans ATCC 2091
【字体:
大
中
小
】
时间:2025年11月30日
来源:Molecular Diversity 3.8
编辑推荐:
本研究针对真菌耐药性日益严重的临床挑战,通过构建基于遗传算法-多元线性回归(GA-MLR)的定量构效关系(QSAR)模型,系统分析了51种4-芳基-2-肼基噻唑衍生物的抗白色念珠菌(Candida albicans ATCC 2091)活性。研究发现RDF100e、ITH、R4+(m)、RDF120s和GATS8e五个分子描述符与pMIC值呈负相关,并通过原子对分布、亚结构分析和分子表面映射三种方法揭示了N1-肼基与C4-芳基空间排列、范德华力相互作用和电子效应对活性的影响规律。该研究为小数据集条件下抗真菌药物的理性设计提供了新范式。
随着免疫抑制患者数量增加和广谱抗菌药物滥用,侵袭性真菌感染已成为全球公共卫生重大威胁。白色念珠菌(Candida albicans)作为最常见的条件致病真菌,不仅能引起黏膜和皮肤感染,更是烧伤患者创面感染和医院获得性血流感染的重要病原体。世界卫生组织(WHO)最新发布的真菌优先病原体清单(FPPL)已将白色念珠菌和耳念珠菌(C. auris)列为关键优先级,后者更是出现了泛耐药菌株,死亡率高达29%-53%。目前临床主要使用唑类(如氟康唑)、多烯类(如两性霉素B)和棘白菌素类药物,但耐药性问题日益突出,特别是唑类药物的高耐受性导致持续性念珠菌血症和耐药菌株筛选。因此,开发新型抗真菌药物迫在眉睫。
在此背景下,托伦哥白尼大学的研究团队在《Molecular Diversity》发表了一项创新性研究,通过可解释性定量构效关系(QSAR)建模方法,系统揭示了4-芳基-2-肼基噻唑衍生物的抗白色念珠菌活性机制。研究团队针对此前文献中缺乏针对此类化合物的系统QSAR分析和分子描述符解读方法的现状,开展了一项结合计算化学与机器学习的跨学科研究。
研究采用的关键技术方法包括:基于密度泛函理论(DFT B3LYP/6-311G**)的分子几何优化、alvaDesc计算的5471种分子描述符筛选、遗传算法-多元线性回归(GA-MLR)模型构建、留一法交叉验证(LOO-CV)和Y随机化检验,以及新型ARKA(算术残差K组分析)降维技术。研究团队还开发了三种原创的描述符解读方法:原子对分布分析、亚结构贡献分析和分子表面映射分析。
通过多标准决策分析(MCDM)筛选出的最优模型包含五个描述符,其线性方程为:pMIC = 4.6771 - 0.5651·RDF100e - 0.4206·ITH - 0.2905·R4+(m) - 0.2070·RDF120s - 0.1308·GATS8e。所有描述符的负回归系数表明,降低这些描述符的值可增强抗真菌活性。模型验证显示确定系数R2为0.8514,留一法交叉验证Q2为0.7809,均方根误差(RMSE)训练集为0.197,测试集为0.254,表明模型具有优秀的预测能力和稳健性。
研究团队创新性地提出了三种描述符解读方法:原子对分布分析将描述符值分解为原子对贡献(γij)之和;亚结构方法将分子划分为四个片段(F1公共核心、F2肼基连接区、F3芳基取代区、F4特殊取代区),分别计算片段内(ε)和片段间(δ)贡献;分子表面映射则通过累积原子贡献(Ωn)在溶剂可及表面(SASA)上进行可视化展示。
RDF100e(径向分布函数-100/桑德森电负性加权)主要编码F2和F3片段在10?距离内的空间关系。研究发现,当原始值低于5.368时对活性有利。氟原子在苯环对位取代时,由于F37-N1原子对距离(9.94?)接近球壳半径,贡献值高达1.2,而氯(10.35?)和溴(10.51?)因距离差异较大而贡献可忽略。亚结构分析显示,G1和G2组化合物的描述符值主要取决于δF3-F2贡献,而G3和G4组则受δF2-F1影响显著。
RDF120s(径向分布函数-120/I-State加权)表征12?距离内原子的空间分布。研究发现,含有-NHCOCH3、-CF3、-NO2等高I-State值取代基的化合物描述符值较高,而活性最高的G3_3o化合物仅由一个γH30-H22原子对贡献,权重商为1。
ITH(杠杆平等总信息含量)由分子复杂度(A0·log2A0)和空间有序度(∑Ng·log2Ng)共同决定。阈值分析表明,63%的高活性化合物ITH值低于67.069。比较G3_3o(最低ITH)和G5_3g(较高ITH)发现,原子数减少和对称性增加有利于降低ITH值,从而提升活性。
R4+(m)(最大自相关滞后4/质量加权)仅由单个原子对贡献决定。研究发现,苯环2,4位双氟取代(G2_3g、G3_3i、G4_4i)或对位溴取代(G2_3b、G1_3c等)会导致描述符值超过0.0454阈值,对活性产生负面影响。
GATS8e(滞后8的Geary自相关/电负性加权)评估拓扑距离为8的原子间电负性相似性。原始值低于0.872表示正空间自相关,有利于活性。电负性差异分析显示,含有-CH3、-Br等取代基的原子对(wi-wj)2接近零,而-NO2、-CN等取代基则导致显著差异。
为克服小数据集建模局限,研究应用ARKA方法将五维描述符空间降维至ARKA_1和ARKA_2两个维度。散点图分析显示,活性化合物集中在ARKA_1正、ARKA_2负的"4-确信阳性"区域,其中R4+(m)是主要区分因子。非活性化合物则位于ARKA_1负、ARKA_2正的"2-确信阴性"区域,由RDF100e、RDF120s、ITH和GATS8e共同决定。
基于解读结论,研究团队设计了三个新化合物:C1保留G3_3o的C9-C6原子对但将环己烯基替换为环丙基;C2在G2系列基础上引入电负性最低的碘原子;C3完全去除电负性原子。预测显示C1的pMIC高达8.41,最具开发潜力。
研究结论表明,4-芳基-2-肼基噻唑衍生物的抗真菌活性主要受以下因素调控:N1-肼基与C4-芳基的空间排列是关键决定因素;范德华力作用略优于静电相互作用;连接基和芳环取代基中电负性原子数增加会降低活性;给电子基团(如甲基、卤素)增强活性,吸电子基团(如硝基、氰基)降低活性。该研究不仅为抗真菌药物设计提供了具体结构优化策略,更重要的是建立了一套适用于小数据集的QSAR模型解读方法论,实现了从"黑箱"预测到"白箱"设计的转变。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号