
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于量子化学描述符的随机森林模型预测Raphidocelis subcapitata化学毒性
【字体: 大 中 小 】 时间:2025年04月22日 来源:Algal Research 4.6
编辑推荐:
本研究针对有机化合物对水生生物Raphidocelis subcapitata的毒性评估难题,创新性地采用43种量子化学描述符结合随机森林算法,构建了pEC50和pEC10毒性分类模型,训练集准确率达100%,测试集超90%。该模型通过原子电荷、前沿轨道能等参数揭示毒性机制,为环境风险评估提供了高效计算工具,发表于《Algal Research》。
随着工业发展和化学品年产量的激增(约23亿吨),有机污染物如酚类、农药等对水生生态的威胁日益严峻。Raphidocelis subcapitata(一种对污染物高度敏感的绿藻)作为水生毒理学模式生物,其毒性数据获取却受限于传统实验的高成本与耗时。现有QSAR(定量构效关系)模型多依赖传统描述符(如logKow),难以全面反映分子三维电子结构信息。为此,研究人员首次将量子化学描述符与随机森林算法结合,构建了高精度毒性分类模型。
研究采用334种有机化合物的pEC50和pEC10毒性数据(源自Khan和Roy的公开数据集),通过量子化学计算获取43种描述符,包括原子电荷、多极矩、前沿轨道能等。利用MATLAB R2024a的RandomForest包优化参数(mtry=√n,ntree=500),最终筛选22个关键描述符建立模型。
随机森林分类QSTRs
模型对pEC50和pEC10的训练集准确率均达100%,测试集超90%。最具预测力的描述符为最负原子Mulliken电荷(反映反应位点)和分子极性(与氢键形成相关),表明毒性机制涉及电负性相互作用和空间位阻效应。
结论与意义
该研究证实量子化学描述符能有效关联Raphidocelis subcapitata毒性,揭示了电子分布(如LUMO能级与亲电活性)和热力学性质的关键作用。模型为REACH法规和OECD框架下的快速毒性筛查提供了新工具,尤其适用于未合成化合物的风险评估。作者Xinliang Yu强调,该方法突破了传统QSAR的维度限制,未来可扩展至其他水生生物毒性预测领域。
生物通微信公众号
知名企业招聘