编辑推荐:
研究人员为解决分子优化算法未充分考虑合成性问题,开展 Syn-MolOpt 研究,结果良好,对药物研发意义重大。
在药物研发的漫长征程中,寻找具有理想特性的新型分子就像在浩渺的化学宇宙里探寻宝藏。传统的药物研发主要依赖人力,专家们凭借经验设计、合成和评估新分子。这种方式虽然取得了不少成果,但高昂的成本和漫长的时间消耗,严重限制了对化学空间的探索。随着深度学习(DL)技术的兴起,情况有了转机,生成模型在分子设计领域大放异彩,大大提高了寻找最优化合物结构的效率。然而,这些模型仍有不足,能成功找到满足多种预设特性分子的例子少之又少,因此分子优化在药物研发中的重要性愈发凸显。
近年来,基于 DL 的分子优化算法不断涌现,在计算机模拟测试中表现出色。但它们大多有个严重缺陷,就是没有充分考虑分子的可合成性。这意味着优化后的化合物可能在实际合成中困难重重,给后续的实验测试带来巨大挑战。为了解决这个问题,有些研究将合成可及性(SA)分数纳入分子优化算法,但这种方法依赖预先设定的化学规则和启发式规则,不仅预测准确性受限,还无法提供实际的合成路径。
在这样的背景下,浙江大学药学院、澳门理工大学等机构的研究人员 Xiaodan Yin、Xiaorui Wang 等人开展了一项重要研究,相关成果发表在《Journal of Cheminformatics》上。研究人员提出了一种基于功能反应模板的合成规划驱动的分子优化方案 ——Syn-MolOpt(Synthesis planning-driven Molecular Optimization method using data-derived functional reaction templates) ,为药物研发带来了新的希望。
研究人员在开展研究时用到了几个主要关键的技术方法。首先,利用子结构掩码解释方法(SME)构建特定属性的功能反应模板库。通过关系图卷积网络(RGCN)算法训练共识模型,计算子结构对目标属性的贡献值。然后,从开源反应数据集提取反应模板并筛选。在模型构建方面,将化合物的合成路径建模为合成树,以自底向上的方式构建,将其视为马尔可夫决策过程,训练四个神经网络分别预测反应动作、第一反应物、反应模板和第二反应物。在分子优化阶段,结合功能反应模板和遗传算法(GA)对分子进行优化。
下面来看具体的研究结果:
功能反应模板库的设计 :以诱变毒性(Mutagenicity,Mutag)为例,研究人员先构建用于属性预测的共识模型,通过 SME 将分子数据集剖析为各种子结构并分配贡献值,得到带有属性值的诱变毒性功能子结构数据集。再从开源反应数据集提取通用的 SMARTS 逆向合成反应模板并转化为正向反应模板,最后经过三步筛选得到功能反应模板库。
Syn-MolOpt 的性能测试 :研究人员进行了多项多属性分子优化实验,包括两个毒性相关(GSK3β-Mutag 和 GSK3β-hERG)和两个代谢相关(GSK3β-CYP3A4 和 GSK3β-CYP2C19)的优化任务,并与 Modof、HierG2G 和 SynNet 这三个基准模型进行对比。在 GSK3β-Mutag 优化实验中,Syn-MolOpt 在几乎所有指标上优于其他方法,能显著降低分子的诱变毒性(Mutag 分数),同时提高与糖原合酶激酶 3β(GSK3β)的结合亲和力(GSK3β 分数) 。在 GSK3β-hERG 优化任务中,Syn-MolOpt 同样表现出色,有效降低了 hERG 相关的心脏毒性,同时增强了与 GSK3β 的结合亲和力。在代谢性质优化实验中,针对细胞色素 P450(CYP)抑制相关的优化任务,如 GSK3β-CYP3A4 和 GSK3β-CYP2C19,Syn-MolOpt 也取得了较好的结果,能优化分子使其具有更低的代谢抑制特性,同时提高与 GSK3β 的结合亲和力。
真实世界分子优化场景的探索 :在真实世界中,用于优化属性的数据往往不足,难以训练出高精度的定量构效关系(QSAR)模型。研究人员模拟这种场景,从 Mutag 和 hERG 毒性数据集的训练集中分别提取 20% 的数据重新训练共识模型,重建功能反应模板库。结果发现,在低精度评分函数的分子优化任务中,Syn-MolOpt 比 SynNet 表现更优,尤其是在毒性优化方面。
研究结论和讨论部分表明,Syn-MolOpt 考虑了分子优化和合成性,为优化的化合物提供参考合成路线。在多个多属性分子优化任务中,它优于基准模型,证明了其有效性和通用性。功能反应模板在分子优化中起到了重要作用,通过合成树生成过程中对相关片段的有效转化,即使在评分反馈不准确的情况下,Syn-MolOpt 也能表现稳健,适用于真实世界的分子优化场景。不过,该方法也有提升空间,如目前仅为单一属性构建功能反应模板库,未来设计更通用的多属性模板库可能进一步提高分子优化性能。总的来说,Syn-MolOpt 为药物研发提供了一种有价值的工具,有望推动药物研发领域的进步,为解决药物研发中的关键问题带来新的思路和方法。
闂傚倷鑳堕幊鎾绘倶濮樿泛绠插ù锝堟閻牓鏌ㄩ悤鍌涘
婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婇柍瑙勫劤娴滈箖鏌i悢鐓庝喊婵℃彃婀遍埀顒冾潐閹稿摜鈧稈鏅濋埀顒勬涧閵堟悂寮崒鐐村€锋い鎺嶇劍閻﹀酣姊虹拠鎻掝劉缂佸甯″畷婵嬪箳濡も偓缁€澶愭煟閺冨倸甯舵潻婵囩節閻㈤潧孝婵炶尙濞€瀹曟垿骞橀幇浣瑰兊閻庤娲栧ú銊╂偩閾忓湱纾介柛灞剧懅椤︼附淇婇锝囩煉鐎规洘娲熼、鏃堝川椤栵絾绁梻浣瑰缁诲倿鎮ч幘婢勭喓鈧綆鍠楅悡娆愮箾閼奸鍤欐鐐达耿閺屾洟宕堕妸銉ユ懙閻庢鍣崜鐔肩嵁瀹ュ鏁婇柣锝呮湰濞堟悂姊绘担钘変汗闁烩剝妫冨畷褰掓惞椤愶絾鐝烽梺绉嗗嫷娈曟い銉ョ墦閺屾盯骞橀懠顒夋М婵炲濯崹鍫曞蓟閺囥垹骞㈡俊銈咃工閸撻亶鏌i姀鈺佺仭濠㈢懓妫楀嵄闁圭増婢橀~鍛存煟濞嗗苯浜惧┑鐐茬湴閸婃洟婀侀梺鎸庣箓濡瑧绮堢€n喗鐓冪憸婊堝礈濮橆厾鈹嶉柧蹇氼潐瀹曟煡鏌涢幇銊︽珖妞も晝鍏橀弻銊モ攽閸℃瑥鈪靛┑鈽嗗灠椤戝寮诲☉銏犵闁瑰鍎愬Λ锟犳⒑鐠囧弶鍞夊┑顔哄€楃划姘舵焼瀹ュ懐顦ㄥ銈嗘尵婵兘顢欓幒妤佲拺閻犲洠鈧櫕鐏侀梺鍛婃煥妤犳悂鍩㈤幘璇茬闁挎棁妫勫▓銉ヮ渻閵堝棛澧紒顔肩焸閸╂盯寮介鐔哄幈濠电偛妫欓崝鏇㈡倶閳哄偆娈介柣鎰级閸犳﹢鏌熼姘毙х€殿噮鍣e畷鎺懳旀担瑙勭彃
10x Genomics闂傚倷绀侀幖顐﹀磹閻熼偊鐔嗘慨妞诲亾妤犵偞鐗犻垾鏂裤€掓刊鐖剈m HD 闂佽瀛╅鏍窗閹烘纾婚柟鍓х帛閻撴洘鎱ㄥΟ鐓庡付闁诲繒濮烽埀顒冾潐濞叉粓宕伴幘鑸殿潟闁圭儤顨呴獮銏℃叏濮楀棗澧┑顔煎暣濮婃椽宕ㄦ繝鍌滅懆濠碘槅鍋呯划宥夊Φ閺冨牆绠瑰ù锝囨嚀娴犮垽姊洪幖鐐插姉闁哄懏绮撻幃楣冩焼瀹ュ棛鍘遍棅顐㈡搐椤戝懏鎱ㄩ埀顒€鈹戦悙瀛樼稇婵☆偅绮撴俊鐢稿箛閺夊灝宓嗛梺缁樶缚閺佹悂鎮℃担铏圭=濞达絽鎲″﹢鐗堜繆閻愯埖顥夐摶鐐烘煕瑜庨〃鍛矆閸℃稒鐓曢柍鈺佸暈缂傛岸鏌嶈閸忔稓鍒掑▎鎾虫瀬鐎广儱顦伴弲鎼佹煥閻曞倹瀚�
濠电姷鏁搁崑娑樜涙惔銊ュ瀭闁兼祴鏅滃畷鏌ユ倵閿濆骸浜為柍缁樻閹鏁愭惔鈥崇缂備椒鑳跺▍澧俰st闂傚倷绶氬ḿ褍螞濡ゅ懏鏅濋柨婵嗘川缁犳柨顭块懜闈涘婵☆偅蓱閵囧嫰骞樼捄杞扮捕缂傚倸绉崇欢姘跺蓟濞戙垹鍐€闁靛ě鍐f嫛婵犵數鍋涢悧濠囧储椤ョSPR缂傚倸鍊烽悞锔剧矙閹烘鍎庢い鏍仜閻掑灚銇勯幒鍡椾壕濡炪倧缂氶崡鎶藉箖瑜斿畷顐﹀Ψ閵堝棗濯伴梻渚€鈧偛鑻晶鏉戔攽閳ユ剚鍤熼柍褜鍓ㄧ紞鍡涘礈濮樿泛姹查柍鍝勬噺閸婂灚绻涢幋鐐垫噧濠殿喖鍟撮弻娑㈠籍閹炬潙顏�
闂傚倷绀侀幉锟犮€冮崱妞曞搫饪伴崨顓炵亰闂婎偄娲︾粙鎺楀吹閸曨垱鐓熼柟閭﹀墻閸ょ喖鏌曢崼鐔稿唉妤犵偞鐗犲鍫曞箣閻樻鍞堕梻浣告啞閻熴儱螞濠靛棭娼栧┑鐘宠壘鎯熼梺闈涱檧缁茬厧霉閻戣姤鐓熼柣妯夸含閸斿秶鎲搁弶鍨殻闁诡喓鍎甸弫鎾绘晸閿燂拷 - 濠电姷鏁搁崕鎴犲緤閽樺鏆︽い鎺戝閻鏌涢埄鍐$細妞も晜鐓¢弻娑㈠焺閸愭儳姣€闂佸湱鍎ら幐楣冦€呴悜钘夌閺夊牆澧界粔鐢告煕鎼淬垹鐏ラ柍钘夘樀楠炴﹢顢涘顐㈩棜婵犵數鍋為崹鍫曞箹閳哄倻顩叉繝濠傚暟閺嗭箓鏌i弮鍥仩缁炬儳銈搁弻娑㈠焺閸愵厼顥濋梺鍛婃⒐鐢繝骞冨Δ鍛嵍妞ゆ挾鍋樺Σ鎰版⒑缂佹ḿ鈯曢柣鐔濆洤绠悗锝庡枛缁犳煡鏌熸导瀛樻锭闁诡喕绶氬娲川婵犲倻顑傛繝鈷€鍕垫疁鐎殿喗濞婇幃銏ゆ偂鎼达綆鍞规俊鐐€栭弻銊╂倶濠靛牏鐜绘繛鎴欏灪閻撴瑩鎮归妸銉Ц闁稿﹤顭烽幃鐑藉閵堝棛鍘卞┑鐐叉閿氶柣蹇嬪劜閵囧嫰顢曢姀鈺佸壎閻庤娲滄繛鈧€殿喕绮欓、鏍敃閿濆懏璇為悗娈垮枟閹倿寮幘缁樻櫢闁跨噦鎷�
婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婃い鎺嗗亾鏉╂繃绻濋悽闈浶㈤悗姘煎櫍閹本鎯旈妸锔惧幘閻庤娲栧ú銈嗙濠婂牊鐓曢柣鎰摠鐏忥箓鏌熼挊澶娾偓濠氬焵椤掑﹦绉甸柛鎾村哺椤㈡棃濡舵径瀣化闂佽澹嬮弲娑欎繆閾忓湱纾奸柕濞у喚鏆梺鐟板槻閹冲酣銈导鏉戠闁靛ě鈧崑鎾寸節濮橆厾鍘搁柣搴秵閸嬪嫭鎱ㄩ崼銉︾厸鐎光偓閳ь剟宕版惔銊ョ厺闁哄啫鐗嗛崡鎶芥煟濡寧鐝慨锝呭閺岋絾鎯旈姀鈶╁闂佸憡姊圭敮鈥崇暦濠靛鍋勯柣鎾冲閵夆晜鐓ラ柣鏇炲€圭€氾拷