编辑推荐:
疟疾严重威胁全球健康,耐药性问题凸显新抗疟药研发的紧迫性。研究人员开展对 104 种 PfPK6 抑制剂的预测建模研究,构建集成回归与分类模型。结果显示模型预测性能优异,为新型 PfPK6 抑制剂设计提供关键思路。
疟疾是一项重大的全球健康挑战,它导致了较高的发病率和死亡率。耐药性的出现,使得开发新的抗疟药物变得刻不容缓。在这项研究中,研究人员聚焦于 104 种恶性疟原虫蛋白激酶 6(
Plasmodium falciparum protein kinase 6,PfPK6)抑制剂的预测建模。他们运用了一系列机器学习技术,构建了集成回归模型和分类模型。
研究人员利用分类和回归树(classification and regression trees,CART)对分子描述符进行优化,以此识别出最为相关的特征。随后,他们采用了六种机器学习算法,即随机森林(Random Forest,RF)、相关向量机(Relevance Vector Machine,RVM)、支持向量机(Support Vector Machine,SVM)、Cubist、人工神经网络(Artificial Neural Networks,ANN)以及极端梯度提升(XGBoost)来构建回归模型。其中,共识模型展现出了卓越的预测性能,其测试集决定系数 R2Test达到 0.94,测试集标准误差 SETest为 0.20,交叉验证系数 Q2CV是 0.90 ,交叉验证标准误差 SECV为 0.25,这些指标均优于单个模型。
在分类任务方面,研究人员评估了五种算法,通过多数投票法,模型达到了 91% 的准确率和 93% 的灵敏度。此外,通过适用性域分析(覆盖度达 96%)和 y 随机化检验,进一步证实了模型的稳健性,确保预测结果并非偶然相关性所致。
这项研究充分彰显了集成机器学习方法在预测建模中的有效性,为新型 PfPK6 抑制剂的合理设计提供了至关重要的见解。