ShennongAlpha:开启天然药材知识智能共享新时代,助力全球生物医药发展

《Cell Discovery 13.0》:ShennongAlpha: an AI-driven sharing and collaboration platform for intelligent curation, acquisition, and translation of natural medicinal material knowledge

【字体: 时间:2025年04月02日 来源:Cell Discovery 13.0

编辑推荐:

  为解决天然药用材料(NMMs)知识在利用和共享中面临的关键信息标准化描述、高效整理获取及语言障碍等问题,研究人员开展了以开发 ShennongAlpha 平台为主题的研究。结果是构建了包含超 14,000 种中国 NMMs 知识的平台,该平台在 NMMs 知识共享领域意义重大,推动了相关研究与应用。

  天然药用材料(Natural Medicinal Materials,NMMs)在全球临床应用历史悠久,积累了海量知识,是药物研发和临床治疗的重要源泉。然而,当前 NMMs 知识的利用与共享困难重重。一方面,缺乏标准化和系统的命名法,致使 NMMs 难以准确区分和识别,比如青蒿素的发现过程中,“青蒿” 一名对应多种植物,给研究和应用带来极大困扰;现有信息记录繁杂,传统整理和获取知识的方式效率低下。另一方面,语言障碍严重阻碍了 NMMs 知识的全球传播。这些问题限制了 NMMs 在生物医药领域的深入研究和广泛应用,开发一个能够有效解决这些问题的平台迫在眉睫。
为攻克这些难题,来自西湖大学、复旦大学等机构的研究人员开展了一项创新性研究。他们开发了 ShennongAlpha 平台,这是一个基于人工智能驱动的 NMMs 知识智能整理、获取和翻译的共享协作平台。该研究成果发表在《Cell Discovery》上,为全球生物医药、制药、医疗行业以及患者群体带来了新的曙光。

在研究过程中,研究人员运用了多种关键技术方法。首先,开发了系统命名法(Systematic Nomenclature)的算法及在线应用 ShennongName,为 NMMs 的准确命名和识别提供了有力支持;设计了多语言 Markdown(Multilingual Markdown,MLMD)格式,实现了多语言知识的有效管理;构建了 ShennongAlpha 知识库(ShennongAlpha Knowledge Base,ShennongKB),整合了丰富的 NMMs 相关数据;还打造了 ShennongAlpha 搜索引擎(ShennongAlpha Search Engine,ShennongSearch),并采用了基于共指的图搜索(Coreference-based Graph Search,CGS)等先进搜索方法,提升了知识检索效率。

研究结果如下:

  • 系统命名法定义 NMMs 的独特身份和关键信息:引入系统命名法,为每个 NMMs 赋予系统名称、通用名称和唯一的 NMM ID。系统名称包含物种起源、药用部位、特殊描述和加工方法等关键信息,有效消除了传统命名带来的歧义。例如,“净片姜黄” 的系统名称 “Curcuma wenyujin Rhizome Freshly-sliced Cleaned”,清晰表明了其物种来源、药用部位及加工方式。研究人员还开发了 ShennongName 算法和应用,方便用户贡献和修改 NMMs 条目,实现了 NMMs 命名的标准化、高效化。
  • ShennongAlpha 平台的构建与知识整合:基于系统命名法,研究人员收集整理了 14,256 种中国 NMMs 的知识,将其数字化、结构化后存入 NMM 知识库。ShennongAlpha 平台融合了 ShennongName 与六域模块化系统,具备用户友好的界面,支持中英文双语切换。用户可通过多种方式访问平台知识,如通过 NMM ID 直接访问知识页面,利用搜索功能查找相关信息,还能使用 “按名称组件搜索 NMMs” 的高级搜索模块,精准定位所需知识。知识页面采用分层树状结构,方便用户浏览,且支持多种语言显示模式,满足不同用户需求。
  • 用户对 NMMs 知识的访问与贡献:用户可通过 ShennongAlpha Web 便捷地访问 NMMs 知识。平台知识页面提供了丰富的功能,用户不仅能浏览知识,还能保存、引用、下载页面内容,以 JSON 格式下载的内容便于用户进行后续编程处理。同时,ShennongAlpha 是一个开放协作的平台,鼓励全球用户贡献知识。用户可在知识页面提交新信息或修改现有内容,经审核后这些贡献将被整合到知识库中,贡献者的名字和头像会在 “贡献者” 部分展示,激励更多用户参与协作。
  • 基于聊天的 NMMs 知识获取:ShennongAlpha 平台推出了 AI 驱动的聊天应用 ShennongChat。用户通过自然语言提问,ShennongChat 借助先进的大语言模型(LLM)系统和搜索引擎,实时搜索知识库并以自然语言回复用户。例如,当用户询问 “麻黄的物种起源是什么” 时,ShennongChat 能准确回答 “麻黄的物种起源是木贼麻黄、中麻黄或草麻黄”,并提供相关 NMM ID。为增强回答的专业性和可解释性,ShennongChat 采取了用户指导、信息来源透明化、交互式知识探索等措施,还支持多语言交互,提升了用户体验。
  • NMMs 知识的标准化和可解释翻译:针对语言障碍问题,ShennongAlpha 平台开发了 ShennongTranslate 应用。该应用基于自主研发的神经网络机器翻译算法(Neural Machine Translation based on Coreference Primary Term,NMT-CPT),能实现 NMMs 知识的标准化和可解释翻译。例如,翻译 “麻黄是一种天然药材” 时,会将 “麻黄” 准确翻译为 “Ephedra equisetina vel intermedia vel sinica Stem-herbaceous (NMM-0006, Ma-huang)”,并对标准化翻译和用户自定义术语进行颜色高亮显示,用户悬停在翻译术语上可查看双语摘要,点击可跳转至相关知识页面,使翻译应用兼具知识探索功能。

在研究结论和讨论部分,研究人员指出,全球知识共享对 NMMs 领域至关重要,系统命名法和 ShennongAlpha 平台的出现意义非凡。系统命名法首次为 NMMs 提供了标准化的区分和识别体系,ShennongAlpha 平台则实现了系统命名法的自动化实施,打破了语言障碍,促进了知识的交互获取和全球共享。然而,该平台也存在一些局限性,如目前知识主要来源于中国 NMMs,标准化和结构化知识类型有限,缺乏实验数据等。未来,研究人员计划纳入更多其他国家和地区的 NMMs 知识,并开发先进的 AI 方法整合实验数据,打造更完善的 NMMs 知识平台。

总的来说,ShennongAlpha 平台将人工智能与 NMMs 知识共享紧密结合,为全球 NMMs 研究和应用提供了强大的支持,推动了该领域的知识共享和协作,有望促进全球健康事业的发展。

涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒

10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�

娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功

鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�

涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号