
-
生物通官微
陪你抓住生命科技
跳动的脉搏
SAGE-Amine:基于多属性优化的生成式胺设计助力高效CO2捕获技术突破
【字体: 大 中 小 】 时间:2025年05月27日 来源:Carbon Capture Science & Technology 10.4
编辑推荐:
本研究针对传统胺类溶剂在CO2捕获中存在的反应性、粘度和吸收容量优化难题,开发了整合评分辅助生成探索(SAGE)与定量结构-性质关系(QSPR)模型的SAGE-Amine系统。通过自回归自然语言处理模型,实现了从零设计新型胺分子,成功完成单属性(如pKa、粘度)和多属性(高碱性/低粘度/低蒸气压)协同优化,经COSMO-RS模拟验证的10种顶级胺分子展现出显著应用潜力,为工业碳捕集提供了创新解决方案。
随着全球工业化进程加速,化石能源持续消耗导致大气CO2浓度急剧上升,加剧温室效应和气候变化。尽管海洋具有一定的CO2吸收能力,但其自然净化速率远跟不上人类活动的排放速度。在此背景下,碳捕集与封存(CCS)技术成为缓解气候危机的关键手段,其中胺基溶剂因其与CO2的高反应活性,成为燃烧后碳捕集的主流选择。然而传统胺类如单乙醇胺(MEA)、二乙醇胺(DEA)等存在化学降解、腐蚀性强、再生能耗高等固有缺陷,且通过实验筛选优化胺分子需耗费大量时间与资源。
针对这一挑战,研究人员开发了名为SAGE-Amine的创新性生成建模方法。该系统突破传统虚拟筛选受限于已知化合物数据库的局限,通过整合评分辅助生成探索(SAGE)框架与定量结构-性质关系(QSPR)模型,实现了从分子层面设计新型胺类溶剂。研究证实,SAGE-Amine不仅能重新发现已知CO2捕获胺分子,还可通过自回归自然语言处理技术生成具有优化特性的全新分子,相关成果发表在《Carbon Capture Science》期刊。
研究团队主要采用四大关键技术:1)基于SMILES(简化分子线性输入规范)的自回归神经网络(LSTM/Transformer/XTD)预训练;2)结合遗传算法(GA)的化学多样化操作;3)建立涵盖粘度、蒸气压等关键参数的QSPR预测模型;4)通过COSMO-RS(类导体屏蔽溶剂模型)进行热力学性质模拟验证。所有计算基于ZINC20和QSPR数据库中的胺类数据集,分子量阈值设为250/300 g/mol形成Amine250/Amine300训练集。
在"评分辅助胺生成探索(SAGE-Amine)"部分,研究构建了生成-评估的迭代优化循环。不同于传统虚拟筛选,系统通过自然语言处理模型生成SMILES序列,经化学多样化修饰后,使用QSPR模型评估pKa、粘度等八项关键指标,最终筛选最优分子用于模型微调。
"胺数据库预训练"结果显示,XTD模型在Amine300数据集表现最佳,生成分子中80%为有效胺类,且能产生训练集外的新型多胺结构。Transformer模型则倾向于复制已知分子,而LSTM和TD在生成环状胺方面更具优势。
"目标导向基准测试"证实XTD/GA混合模型综合得分最高(23.744),在重新发现MEA等10种典型胺分子任务中均获满分,在相似度匹配和异构体生成任务中同样表现突出。特别值得注意的是,该系统成功生成了C4H11NO2等指定分子式的所有可能异构体。
"单属性优化"实验表明,LSTM/GA模型能快速产生pKa>14的高碱性胺,TD/GA在降低粘度(log10 cP<-0.5)方面表现优异,而XTD/GA可将蒸气压预测值降至-25.878 mmHg。所有模型均突破训练集属性边界,展现出超越现有数据库的探索能力。
"多属性优化"环节通过八项指标加权评估,XTD/GA生成的胺类在保持合成可行性(RAscore>0.8)和合理成本(<10$/g)前提下,pKa提升2.853,粘度降低0.237 log10 cP。COSMO-RS模拟显示优选分子具有更低的CO2亨利常数(-9.222 MPa)和更高闪点(+9.903°C),其中排名前10的分子结构呈现明显的羟基/氨基协同分布特征。
该研究的突破性在于将生成式人工智能引入碳捕集材料设计领域。SAGE-Amine通过算法创新实现了:1)从被动筛选到主动设计的范式转变;2)多目标参数协同优化;3)超越已知化学空间的分子发现。尽管当前QSPR模型覆盖属性和精度仍有提升空间,但这项工作为加速碳中和材料开发提供了可扩展的技术框架。未来通过引入更大规模预训练数据和增强模型参数,有望进一步释放生成式设计在环境友好型分子发现中的潜力。研究揭示的"高碱性-低粘度"分子设计原则,对开发新一代低能耗碳捕集工艺具有重要指导价值。
生物通微信公众号
知名企业招聘