科学家努力建立生物信息学“标准”

【字体: 时间:2000年10月12日 来源:

编辑推荐:

  

  

目前成立的众多协会努力寻找出生命科学领域的通用计算机语言

想象一下你在另一个地方的合作者手头有你马上要作的一份报告所需的材料。他将该材料用email传送给你,但是数据是以电子数据表程序的形式存储的,而你却只有文字处理程序,这样你就不可能将这份材料切割下来,再粘贴到你的文件中。你只好将它打印出来,再把数据重新输入。这是现在生物学家们经常遇到的情况。尽管现在各种生物学信息数据库很多,尤其是在这个后基因组测序时代,但是许多研究者就象被海洋包围仍会渴死一样,尽管他们所需要的就在他们周围,但是这些东西他们却没法用。

为了解决这一问题,由学术界的科学家和生物技术和制药公司的研究者们组成的各种组织,现在正走到一起以努力设定生物信息学的计算机标准,以帮助生物学家们可以更容易的获得数据,并最大程度地应用来自人类基因组计划(Human Genome Project)的大量信息。他们的目的是不仅帮助研究者可以轻松地在大量DNA序列和那些DNA编码的蛋白三维结构数据库之间切换,而且希望能让科学家们更有效地获得这些数据。以“汽车”举例,如果你敲入“Camaro”,结果你获得的信息将包括其它汽车,因为这个系统足够聪明到知道Camaro是一种汽车。

解决这一问题后首先会加快新药物的开发。剑桥Millennnium Pharmaceuticals公司的信息部副主席Tim Clark说:“制药研究是我所知的唯一一个生产力衰退的产业。研发过程还停留在原始手工业水平。”

现在的问题是最后使用哪个标准的问题。回想20世纪70年代的计算机工业,当时每个人都鼓吹他们自己的标准。现在全世界出现了不少正式的组织,如BioPathways Consortium,Object Management Group的Life Sciences Research Domain Task Force,和Bio-Ontologies Consortium,他们每个组织对于问题的解决都有不同的观点。神经科学家Eric Neumann,同时是Bio-Ontologies和BioPathways consortia的成员,还是剑桥3rd Millennium咨询公司的生命科学信息部副主席。他说可扩展的标记语言[Extensible Markup Language (XML)]将成为生物信息学的标准计算机语言。XML是由超文本标记语言[Hypertext Markup Language (HTML)]扩展而来,是当前国际互联网使用的计算机语言[参考1999年5月《Scientific American》上由Jon Bosak和Tim Bray发表的“XML and the Second-Generation Web”]。

XML的优点之一是它带有通过输入名鉴定每种信息的标记,比如输入“Camaro”,将代表是“汽车”。Neumann提出以XML为基础的语言将“强调生物信息学的类似网络的自然”,其中包括从DNA到信使RNA,蛋白,蛋白-蛋白相互作用,生物医学途径,细胞功能,以及最终整个生物体的行为。据Neumann介绍,目前存储和搜寻这种生物信息的方法集中在单个基因,“但是我们需要治疗的疾病包括了不止一个基因的作用。”

Clark说制定生物信息学标准目前面临的主要问题是,数据的绝对量,高级模式识别的需要(如在DNA序列中和蛋白质结构域中的模式),从数据中清除“噪音”的信号处理能力,以及通过大量迷乱的分子相互作用寻找出最佳途径(也成为组合最优化)。

Neumann认为组合最优化是最大的障碍。“各种途径比DNA序列要复杂得多,如果我们不能在这方面有所作为,那将会是真正的一团糟。”

——摘译自Scientific American

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:|

  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号