寻找致病基因和群体遗传学研究的“金矿”
【字体:
大
中
小
】
时间:2006年01月25日
来源:中国科技网
2005年12月,国家科技部和生物工程中心组织专家组对“十五”重大科技专项中的课题“人类基因组3号、21号染色体和8号染色体短臂的单体型图的构建”听取了结题汇报并通过了现场验收。
“这也是刚刚结束的人类基因组国际单体型图计划(HaplotypeMapProject,简称HapMap计划)的‘中国卷’。2002年几乎在国际计划宣布启动的同时就被列入‘十五’重大科技攻关项目”,该项目的课题组长曾长青告诉记者。
遗传多态人类基因组研究新热点
“你们所测定和分析的SNP与研究人类自身遗传信息是什么关系?”交谈刚开始记者就迫不及待地提出了疑问。
曾长青说:“任何两个人类个体的基因组中有99.9%的DNA序列是完全相同的。也就是说随便两个人之间,有千分之一的序列差异。所以,如果说测序计划解读了遗传密码的天书,那么每一个人的基因组,就是这天书的一个版本。个体间遗传上的区别,包括不同外貌,罹患疾病的敏感性差异等等,都包含在群体的DNA序列差异中。”
“我们所分析的单核苷酸多态性,又叫SNP,就是DNA上单个碱基在不同个体中的差异存在,最大程度地代表了不同个体之间的遗传差异。因此,基因组的序列变异和多态性已成为人类疾病遗传研究的热点。”
“我们开展HapMap计划的意义何在呢?”我问道。
“SNP的许多特性使其成为研究复杂疾病、药物敏感性及人类进化的重要标记。但如果每项研究都要对所有样品中即使是基因组中的一部分序列的每个SNP位点进行检测,费用也是惊人的昂贵。”曾长青解释道。
针对这一点,国际协作组提出了在测序数据的基础上,通过对亚、非、欧裔269个个体全基因组中多态位点的研究,构建世界上主要族群基因组的遗传变异图谱,在群体范围内对人类基因组加以诠释,并找出标签SNP位点,为各种疾病相关和进化研究提供最基本的信息与分析工具。
“从这个角度上说,HapMap计划也是人类基因组测序计划的续集。”曾长青答道。
理论和技术的创新引领基因组学研究的前沿
HapMap计划通过对亚、非、欧裔共269个个体全基因组中基因组序列上常见的多态位点(SNP)进行分析,构建出整合了人类遗传多态信息的“单体型图”,将为疾病易感性、药物敏感性和人类进化研究提供最基本的信息与分析工具。这一计划是根据遗传多态领域的最前沿研究而提出和设计,其技术路线的制定、样品设计、结果的分析与推算等,都代表了当前最先进的科研成果。
“HapMap计划的创新点都体现在什么地方?”讲到创新点,勾起了记者的兴趣。
曾长青介绍道:“一是在全基因组规模的单体型图构建方面。HapMap的理论基础是染色体上的SNP的组合结构,研究已证实单条染色体上相邻的SNPs是在成组遗传的,由此形成的这种组合称之为单体型。‘国际单体型图计划’根据人类基因组图谱对常见的遗传多态位点进行群体样品的测定和分析,绘制人群中常见的遗传差异的图谱,从而建立人类遗传的群体信息资源。”
“此外,HapMap计划其技术路线的制定、样品设计、结果的分析与推算等都是根据遗传多态领域的最前沿研究而提出和设计。其关键技术有两方面:大规模、高通量、低成本的SNP分型技术和全基因组单体型图构建及其标签SNP挑选相关的算法与软件,都代表了当前最先进的科研成果。”说到创新的成就,曾长青眼中闪烁着奕奕的光彩。
遗传用表指导复杂性疾病研究
曾长青继续介绍到,对人类危害严重的常见复杂性疾病(如心血管疾病,癌症,糖尿病等)的遗传因素与多个基因的常见遗传变异有关,每一变异的单独效果并不明显,因而寻找疾病相关基因非常困难。
HapMap计划的目的就是为人类复杂性疾病遗传的相关研究提供了群体水平的完整数据和最先进的手段与分析方法。它提供的是经过实验分型和复杂运算的一个具有全基因组规模和群体信息的遗传用表,为疾病和遗传关联分析、确定致病基因,提供人类基因组的完整信息与有效的研究工具。
“HapMap的另一个成果是标签SNP的选择。应用HapMap的数据和方法,研究人员可以在全基因组近400万个分型测定的多态位点基础上,在自己所研究的区域选取标签SNPs进行测定从而大大降低试验成本。”曾长青开心地说。
“在此基础上开展常见疾病致病基因定位、药理反应差别等研究,将最终为复杂性疾病的诊断、治疗乃至预警预防提供分子遗传的数据基础。”说到成果曾长青脸上挂着掩饰不住的笑容。
建立自己的遗传差异图谱
日本团队最初提出过负责提供全部亚洲样品,正是由于中国团队的参加,争取到提供一半的亚洲样品,使得这一巨大的人类遗传数据库中有六分之一来自汉族人群。
试想,这将为我国进一步的医学遗传研究提供多大便利?
“建立中华民族的多态性数据库是课题组的当务之急。目前,在常染色体数据中,通过构建染色体特定区域内的单体型,我们已经获得了一套特异标签SNPs,对汉族人群的识别度超过97%。”对于中华民族的遗传差异图谱,曾长青满怀信心。
从1%到10%优质完成“中国卷”计划
从测序计划的1%到HapMap计划的10%,体现出中国科学家在基因组学研究领域迅速提高的能力和地位。然而,这一项目的完成也十分艰难。
HapMap项目的中国部分有几大难点,一是起步晚,项目开始时,大家并不站在相同的起跑线上,其他国家的中心都已经在SNP分型方面建立了平台,积累了丰富的经验。而中国团队的三个平台,包括北京的中科院北京基因组所暨华大基因研究中心、上海的国家人类基因组南方研究中心和香港小组的港大平台,都是从“shopping(购买设备)”开始。
从购置安装设备、优化条件到产生数据,三年计划完成的项目,中国卷的起步就晚了近一年。二是资金严重不足,尤其是基因组所承担了中国卷的主要部分,项目经费平均至每个碱基,只相当于香港小组的一半出头,以这样的经费,要通过高通量、大规模的SNP分型反应追赶遥遥领先的其他团队,其难度和压力可想而知。
“用比别人低的成本去赶上我们落下的老长距离,除了拼命就没有法子了。”曾长青严肃地说。
“你知道我们一天能做多少反应?”
“最高记录是30万。两年多来,“中国卷”共上交通过质控检查的SNP分型数据是2500多万。”
“拼命是两种含义,一是所有人员牺牲节假日,机器24小时连轴转,二是使劲在每一个细节上把关,一分一厘的降低反应成本和运用科学理论,提高反应效率与成功率。我们是在最前沿领域使用高新技术进行实验反应和产生科学数据,单纯靠不睡觉也是完不成任务的。”曾长青如是说。
“最后你猜怎么着。”她饶有兴致地问道。我笑笑说:“巨大的成功是一定的。”
曾长青笑了:“我们完成了平台建设,用了半年多的时间,在2004年夏天就把进度赶上来了。到2005年初,中国团队是第一个完成所有补洞的。之所以能够在这么短的时间,用比别人少得多的经费,优质写完这本中国卷,还有一个必要条件,就是所有参加人员的相互支持和精诚合作。”
讲到这里,曾长青动情地说:“我们的员工和研究生们付出了极大心血,整个中国团队的各个小组、平台之间从始至终互相关照和帮助。就是与供应商和经贸人员的关系也大大超出了一般的商家—顾客关系。占整个计划10%%的HapMap中国卷的完成,有大量人员做出了无私贡献,我要向他们鞠躬致谢。”
■专项备忘
国际HapMap计划于2002年10月28日正式宣布启动,共有来自全球6个国家数十个科研机构参加,研究数据及成果及时、免费对全球公布,是一项真正意义上的跨国界、跨学科的旨在造福全人类的全球合作科学研究计划。
HapMap计划中国卷的工作于2002年列入科技部“十五”国家重大科技攻关项目。同时香港特区政府对参与HapMap中国卷的三所香港大学也进行了资助。
至2004年夏天,开始赶上国际合作中的进度,至2004年底,完成了将近1600万份反应数据(15895968)。在2005年4个月内则完成SNP分型数据1800多万个(18470880)。
2005年10月26日,参加了HapMap的200余位科学家在美国盐湖城共同宣布:历时3年的人类基因组单体型图计划(HapMapProject)第一阶段工作圆满结束。中国团队作为发起者及合作者之一,为HapMap计划的顺利实施及成功完成做出了重要的贡献。
3年内,中国团队在国际统一的密度要求基础上,就自己负责的染色体区域向国际数据协调中心共递交并通过了国际数据质量控制体系检验的34713312个分型数据,圆满完成了HapMap计划中国卷的数据产生工作。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号