机器学习助力水杨酸溶解度精准预测:多因素关联深度解析

《Scientific Reports》:Advanced analysis on the correlation of salicylic acid solubility to solvent composition, temperature and pressure via machine learning approach

【字体: 时间:2025年03月25日 来源:Scientific Reports 3.8

编辑推荐:

  为解决预测水杨酸在不同溶剂中溶解度的问题,研究人员开展相关研究,发现 CNN 模型预测效果最佳,对相关领域意义重大。

  

研究背景

在固体口服药物生产过程中,结晶是关键环节,其核心在于通过降低活性药物成分(API)在溶剂中的溶解度,使 API 从溶液中析出,形成固体粉末,而这一过程的驱动力便是过饱和状态。想要实现过饱和,精准掌握 API 在不同溶剂、不同温度和浓度下的溶解度变化至关重要。
以往,热力学方法常被用于分析 API 溶解度,但这种方法在实际操作中存在诸多不便,实施难度较大。近年来,机器学习(ML)技术逐渐崭露头角,其凭借强大的数据学习能力,在药物溶解度预测方面展现出独特优势。不过,此前研究多局限于简单模型或单组分系统,对于水杨酸在复杂多变量环境下的溶解度预测,仍存在较大空白。因此,开展更深入、全面的研究,探索水杨酸溶解度与溶剂组成、温度和压力之间的复杂关系迫在眉睫。
来自沙特阿拉伯国王沙特大学(King Saud University)的研究人员,针对这一问题展开研究。他们的研究成果发表在《Scientific Reports》上,为水杨酸结晶过程优化以及相关领域研究提供了新的思路和方法。

研究方法

研究人员采用了先进的 ML 方法来预测水杨酸溶解度。首先进行数据预处理,利用 Min–Max Scaler 对数据进行归一化处理,将特征值映射到 0 - 1 的区间,确保各输入特征在分析中具有平等的贡献。接着,使用 k - 最近邻离群值检测(KNNOD)技术识别并剔除数据集中的离群点,保证数据质量。
随后,研究人员运用多种 ML 模型进行预测,包括卷积神经网络(CNNs)、多项式回归(PR)和核岭回归(KRR)。为优化模型性能,采用 Hyperband 方法对模型超参数进行调优,该方法通过动态分配计算资源,高效筛选出最优的超参数配置。最后,利用决定系数(R2)、均方误差(MSE)和平均绝对误差(MAE)等指标评估模型的预测准确性。

研究结果

  1. 模型性能对比:通过对不同模型预测性能的评估,发现 CNNs 在预测水杨酸溶解度方面表现最为出色。其 R2得分高达 0.989,MSE 为 4.161203×10-05 ,MAE 为 3.760119×10-03 ,表明其预测值与实际溶解度值拟合度极高,预测误差极小。相比之下,KRR 的 R2得分为 0.913873,PR 的 R2得分为 0.815462,二者在预测准确性上均不如 CNNs。
  2. 特征重要性分析:研究人员进一步分析了各输入变量对预测模型的重要性。结果显示,X2(水含量)和 X5(PEG300 含量)是影响水杨酸溶解度的关键因素。由于水杨酸的疏水性,增加水含量会降低其在溶剂中的溶解度;而 PEG300 作为增溶剂,能够显著提高水杨酸在溶剂中的溶解度。

研究结论与意义

本研究成功运用先进的 ML 方法预测了水杨酸在不同溶剂中的溶解度。通过严格的数据预处理、有效的离群点检测以及精心优化的模型选择,研究人员实现了预测准确性的显著提升。其中,CNNs 模型凭借其卓越的性能,在众多模型中脱颖而出,为后续研究提供了可靠的模型参考。
研究结果明确了水含量和 PEG300 含量对水杨酸溶解度的关键影响,这对于优化水杨酸结晶过程具有重要的指导意义。在实际生产中,可依据这些结论合理调整溶剂组成,精准控制水杨酸的结晶过程,提高生产效率和产品质量。
然而,该研究也存在一定的局限性,模型的预测能力依赖于数据集的可用性,无法完全做到精准预测。未来研究可聚焦于将多种 ML 算法相结合,构建更强大的混合模型,进一步提升模型的稳健性和预测能力。总体而言,这项研究为解决复杂的药物工程问题提供了新的视角和方法,为溶解度预测及相关领域的研究搭建了重要的框架,推动了该领域的进一步发展。

濠电偞鍨堕幐鎼侇敄閸緷褰掑炊閳规儳浜鹃柣鐔煎亰濡插湱鈧鎸哥€涒晝鈧潧銈搁弫鍌炴倷椤掍焦鐦庨梺璇插缁嬫帡宕濋幒妤€绀夐柣鏃傚帶杩濇繝鐢靛Т濞茬娀宕戦幘鎰佹僵鐎规洖娲ㄩ悾铏圭磽閸屾瑧顦︽俊顐g矒瀹曟洟顢旈崨顖f祫闂佹寧绻傞悧鎾澄熺€n喗鐓欐繛鑼额嚙楠炴﹢鏌曢崶銊ュ摵鐎殿噮鍓熼獮宥夘敊閻e本娈搁梻浣藉亹閻℃棃宕归搹顐f珷闁秆勵殕椤ュ牓鏌涢幘鑼槮濞寸媭鍨堕弻鏇㈠幢濡ゅ﹤鍓遍柣銏╁灡婢瑰棗危閹版澘顫呴柣娆屽亾婵炲眰鍊曢湁闁挎繂妫欑粈瀣煃瑜滈崜姘┍閾忚宕查柛鎰ㄦ櫇椤╃兘鏌ㄥ┑鍡欏ⅵ婵☆垰顑夐弻娑㈠箳閹寸儐妫¢梺璇叉唉婵倗绮氶柆宥呯妞ゆ挾濮烽鎺楁⒑鐠団€虫灁闁告柨楠搁埢鎾诲箣閿旇棄娈ュ銈嗙墬缁矂鍩涢弽顓熺厱婵炲棙鍔曢悘鈺傤殽閻愬弶鍠橀柟顖氱Ч瀵噣宕掑Δ浣规珒

10x Genomics闂備礁鎼崐鐟邦熆濮椻偓楠炴牠鈥斿〒濯爄um HD 闁诲孩顔栭崰鎺楀磻閹剧粯鐓曟慨妯煎帶閻忕姷鈧娲滈崰鎾舵閹烘骞㈡慨姗嗗墮婵啴姊洪崨濠傜瑨婵☆偅绮嶉妵鏃堝箹娴g懓浠㈤梺鎼炲劗閺呮粓鎮鹃柆宥嗙厱闊洤顑呮慨鈧┑鐐存綑濡粓濡甸幇鏉垮嵆闁绘ḿ鏁搁悡浣虹磽娴e憡婀版俊鐐舵铻為柛褎顨呯粈鍡涙煕閳╁啞缂氶柍褜鍏涚划娆撳极瀹ュ鏅搁柨鐕傛嫹

婵犵數鍋涘Λ搴ㄥ垂閼测晜宕查悗锝庡亞閳绘棃鎮楅敐搴″箺缂佷胶娅墂ist闂備線娼уΛ妤呮晝閿濆洨绠斿鑸靛姇濡ɑ銇勯幘璺轰粶缂傚秳绶氶弻娑㈠冀閵娧冣拡濠电偛鐗婇崢顥窱SPR缂傚倷鐒︾粙鎺楁儎椤栫偛鐒垫い鎺嗗亾妞わ缚鍗抽幃褔宕妷銈嗗媰闂侀€炲苯澧村┑鈥愁嚟閳ь剨缍嗛崜姘跺汲閳哄懏鍊垫繛鎴炵懃婵啴鏌涢弮鎾村

闂備礁鎲¢〃鍡椕哄⿰鍛灊闊洦绋掗崵鍕煟閹邦剦鍤熼柕鍫熸尦楠炴牠寮堕幋鐘殿唶闂佸憡鐟ュΛ婵嗩潖婵犳艾惟闁靛绲煎ù鐑芥煟閻樿京鍔嶇憸鏉垮暣閹儵鏁撻敓锟� - 婵犵數鍎戠徊钘夌暦椤掑嫬鐭楅柛鈩冡缚椤╂煡鏌涢埄鍐惧毀闁圭儤鎸鹃々鐑藉箹鏉堝墽绉甸柛搴㈠灥閳藉骞橀姘濠电偞鍨堕幖鈺傜濠婂啰鏆﹂柣鏃囨绾惧ジ鏌涢埄鍐闁告梹甯¢幃妤呭捶椤撶偘妲愰梺缁樼⊕閻熝囧箯鐎n喖绠查柟浼存涧閹線姊洪崨濠傜濠⒀勵殜瀵娊鎮㈤悡搴n唹濡炪倖鏌ㄩ悘婵堢玻濞戙垺鐓欓悹銊ヮ槸閸婂鎮烽姀銈嗙厱婵炲棙锚閻忋儲銇勯銏╁剶鐎规洜濞€瀵粙顢栭锝呮诞鐎殿喗鎮傞弫鎾绘晸閿燂拷

濠电偞鍨堕幐鎼侇敄閸緷褰掑炊椤掆偓杩濇繝鐢靛Т鐎氼噣鎯屾惔銊︾厾鐎规洖娲ゆ禒婊堟煕閻愬瓨灏﹂柟钘夊€婚埀顒婄秵閸撴岸顢旈妶澶嬪仯闁规壋鏅涙俊铏圭磼閵娧冾暭闁瑰嘲鎳庨オ浼村礃閵娧€鍋撴繝姘厸閻庯綆鍋勬慨鍫ユ煛瀹€鈧崰搴ㄥ煝閺冨牆鍗抽柣妯挎珪濮e嫰鏌f惔銏⑩姇闁告梹甯″畷婵嬫偄閻撳宫銉╂煥閻曞倹瀚�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号