综述:ChEMBL:化学信息学与药物研发领域的 15 年璀璨征程

【字体: 时间:2025年03月11日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  研究人员回顾 ChEMBL 15 年发展,发现其推动了化学信息学和药物研发,未来仍面临挑战。

  

一、研究背景

在 21 世纪初,药物研发领域迎来了大变革时代。高通量筛选(HTS)技术蓬勃发展,化学合成自动化水平不断提高,科学界越发重视竞争前合作与数据共享,开放数据在加速药物研发中的价值也得到广泛认可。与此同时,人类基因组计划的推进,让人们对(潜在)药物靶点的遗传学知识有了大幅增长,对实验研究靶点的需求也日益迫切。一时间,大量生物活性数据如潮水般涌现,可这些数据分散、杂乱,缺乏有效的整理和规范,犹如一盘散沙,严重制约了药物研发的效率。
为了让这些数据 “各归其位”,发挥更大价值,研究人员迫切需要一个能系统收集、整理、标准化和存储生物活性数据的平台。ChEMBL 数据库应运而生,它承载着推动化学信息学和药物研发进步的使命,开启了长达 15 年的发展征程。该研究成果发表在《Journal of Cheminformatics》杂志上。

二、研究方法

研究人员通过全面梳理 ChEMBL 数据库的发展历程,分析其在不同阶段的数据收录情况、架构变化以及功能更新。同时,借助文献计量学方法,利用 PubMed API 检索提及 “ChEMBL” 的文章,分析相关研究的热点和趋势。此外,还对基于 ChEMBL 数据开展的一系列研究进行综合评估,探究其在各个领域的应用成果。

三、研究结果

  1. ChEMBL 的发展历程:ChEMBL 起源于英国生物技术公司 Inpharmatica Ltd 的 “StARlite” 项目,2009 年在 EMBL-EBI 的支持下,以开放获取数据库的形式正式上线。最初,它主要聚焦于从 12 种期刊中提取的结构 - 活性关系(SAR)数据,涵盖约 2.6 万篇文献、33 万种不同的测定方法、5400 个靶点和 44 万种化合物。此后,其数据来源不断丰富,从直接数据提交到整合其他公共数据库,如 PubChem BioAssay 数据库的剂量 - 反应终点数据等。随着数据类型的增加,数据库架构也多次调整,从最初的 15 个面向公众的表格,逐步扩展到 ChEMBL 35 版本的 78 个表格,以适应新的数据需求,如引入唯一标识符、增加描述药物特性的字段等123
  2. 在化学信息学和药物研发中的作用:ChEMBL 为定量构效关系(QSAR)建模提供了丰富的数据支持,助力研究人员构建预测模型,探究化学结构与生物活性之间的关系。同时,它也推动了数据挖掘、预测建模和机器学习等新方法的发展。在计算毒理学领域,ChEMBL 的数据可用于构建预测模型,评估药物的潜在毒性。例如,通过分析特定脱靶的生物活性数据,预测药物对人体醚 - 去极化相关基因(hERG)或肝脏有机阴离子转运多肽(OATPs)的影响。此外,研究人员还能利用 ChEMBL 数据探索小分子的化学和生物相似性,推动化学相似性度量方法、靶点预测算法等领域的发展。而且,ChEMBL 对被忽视疾病的生物活性数据收集也发挥了重要作用,许多基于该数据库的研究聚焦于结核病、登革热和疟疾等疾病478
  3. 研究热点与趋势:通过文献计量学分析发现,使用 ChEMBL 数据的研究主要集中在分子相互作用、药物和靶点研究、抑制剂开发等领域。在研究方法上,对接 / 虚拟筛选、机器学习、QSAR 等技术应用广泛。近年来,随着新冠疫情的爆发,对传染病特别是 SARS-CoV-2 的研究成为热点56
婵°倗濮烽崑娑㈡倶濠靛绠熼柨鐕傛嫹 限量版“Orbitrap480积木”——基础科研有奖互动

四、研究结论与讨论

ChEMBL 在过去 15 年里,已成为化学信息学和药物研发领域不可或缺的数据库。它不仅提供了高质量的生物活性数据,还在方法开发、多学科研究和 FAIR(可发现、可访问、可互操作、可重用)数据共享原则推进等方面发挥了关键作用。其数据助力研究人员探索化学空间,设计更安全有效的药物,攻克被忽视疾病的难题。
然而,ChEMBL 也面临着挑战。随着数据多样性的增加,处理不同类型的测定方法和实验条件变得越发复杂,数据库团队的工作负担也日益加重。为了更好地服务于机器学习应用,未来需要对测定方法进行更精确的注释。
总体而言,ChEMBL 凭借其开放协作和创新的理念,以及严格的数据整理标准,有望在全球范围内继续引领临床前生物活性数据和临床候选药物数据的发展,为化学与生物学的交叉研究持续加速,推动药物研发领域不断向前迈进。

濠电偞鍨堕幐鎼侇敄閸緷褰掑炊閳规儳浜鹃柣鐔煎亰濡插湱鈧鎸哥€涒晝鈧潧銈搁弫鍌炴倷椤掍焦鐦庨梺璇插缁嬫帡宕濋幒妤€绀夐柣鏃傚帶杩濇繝鐢靛Т濞茬娀宕戦幘鎰佹僵鐎规洖娲ㄩ悾铏圭磽閸屾瑧顦︽俊顐g矒瀹曟洟顢旈崨顖f祫闂佹寧绻傞悧鎾澄熺€n喗鐓欐繛鑼额嚙楠炴﹢鏌曢崶銊ュ摵鐎殿噮鍓熼獮宥夘敊閻e本娈搁梻浣藉亹閻℃棃宕归搹顐f珷闁秆勵殕椤ュ牓鏌涢幘鑼槮濞寸媭鍨堕弻鏇㈠幢濡ゅ﹤鍓遍柣銏╁灡婢瑰棗危閹版澘顫呴柣娆屽亾婵炲眰鍊曢湁闁挎繂妫欑粈瀣煃瑜滈崜姘┍閾忚宕查柛鎰ㄦ櫇椤╃兘鏌ㄥ┑鍡欏ⅵ婵☆垰顑夐弻娑㈠箳閹寸儐妫¢梺璇叉唉婵倗绮氶柆宥呯妞ゆ挾濮烽鎺楁⒑鐠団€虫灁闁告柨楠搁埢鎾诲箣閿旇棄娈ュ銈嗙墬缁矂鍩涢弽顓熺厱婵炲棙鍔曢悘鈺傤殽閻愬弶鍠橀柟顖氱Ч瀵噣宕掑Δ浣规珒

10x Genomics闂備礁鎼崐鐟邦熆濮椻偓楠炴牠鈥斿〒濯爄um HD 闁诲孩顔栭崰鎺楀磻閹剧粯鐓曟慨妯煎帶閻忕姷鈧娲滈崰鎾舵閹烘骞㈡慨姗嗗墮婵啴姊洪崨濠傜瑨婵☆偅绮嶉妵鏃堝箹娴g懓浠㈤梺鎼炲劗閺呮粓鎮鹃柆宥嗙厱闊洤顑呮慨鈧┑鐐存綑濡粓濡甸幇鏉垮嵆闁绘ḿ鏁搁悡浣虹磽娴e憡婀版俊鐐舵铻為柛褎顨呯粈鍡涙煕閳╁啞缂氶柍褜鍏涚划娆撳极瀹ュ鏅搁柨鐕傛嫹

婵犵數鍋涘Λ搴ㄥ垂閼测晜宕查悗锝庡亞閳绘棃鎮楅敐搴″箺缂佷胶娅墂ist闂備線娼уΛ妤呮晝閿濆洨绠斿鑸靛姇濡ɑ銇勯幘璺轰粶缂傚秳绶氶弻娑㈠冀閵娧冣拡濠电偛鐗婇崢顥窱SPR缂傚倷鐒︾粙鎺楁儎椤栫偛鐒垫い鎺嗗亾妞わ缚鍗抽幃褔宕妷銈嗗媰闂侀€炲苯澧村┑鈥愁嚟閳ь剨缍嗛崜姘跺汲閳哄懏鍊垫繛鎴炵懃婵啴鏌涢弮鎾村

闂備礁鎲¢〃鍡椕哄⿰鍛灊闊洦绋掗崵鍕煟閹邦剦鍤熼柕鍫熸尦楠炴牠寮堕幋鐘殿唶闂佸憡鐟ュΛ婵嗩潖婵犳艾惟闁靛绲煎ù鐑芥煟閻樿京鍔嶇憸鏉垮暣閹儵鏁撻敓锟� - 婵犵數鍎戠徊钘夌暦椤掑嫬鐭楅柛鈩冡缚椤╂煡鏌涢埄鍐惧毀闁圭儤鎸鹃々鐑藉箹鏉堝墽绉甸柛搴㈠灥閳藉骞橀姘濠电偞鍨堕幖鈺傜濠婂啰鏆﹂柣鏃囨绾惧ジ鏌涢埄鍐闁告梹甯¢幃妤呭捶椤撶偘妲愰梺缁樼⊕閻熝囧箯鐎n喖绠查柟浼存涧閹線姊洪崨濠傜濠⒀勵殜瀵娊鎮㈤悡搴n唹濡炪倖鏌ㄩ悘婵堢玻濞戙垺鐓欓悹銊ヮ槸閸婂鎮烽姀銈嗙厱婵炲棙锚閻忋儲銇勯銏╁剶鐎规洜濞€瀵粙顢栭锝呮诞鐎殿喗鎮傞弫鎾绘晸閿燂拷

濠电偞鍨堕幐鎼侇敄閸緷褰掑炊椤掆偓杩濇繝鐢靛Т鐎氼噣鎯屾惔銊︾厾鐎规洖娲ゆ禒婊堟煕閻愬瓨灏﹂柟钘夊€婚埀顒婄秵閸撴岸顢旈妶澶嬪仯闁规壋鏅涙俊铏圭磼閵娧冾暭闁瑰嘲鎳庨オ浼村礃閵娧€鍋撴繝姘厸閻庯綆鍋勬慨鍫ユ煛瀹€鈧崰搴ㄥ煝閺冨牆鍗抽柣妯挎珪濮e嫰鏌f惔銏⑩姇闁告梹甯″畷婵嬫偄閻撳宫銉╂煥閻曞倹瀚�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号