-
生物通官微
陪你抓住生命科技
跳动的脉搏
陈荣介绍新型SNP:fitSNPs
【字体: 大 中 小 】 时间:2008年12月10日 来源:生物通
编辑推荐:
如果一个基因差异表达程度越高,那么其越有可能是一种疾病相关的DNA变异,来自斯坦福大学医学院的研究人员近期介绍了利用一种基于差异表达率的SNPs来筛选目标基因的新方法,这一研究成果公布在12月的《Genome Biology》杂志上。
生物通报道:如果一个基因在各种疾病中的差异表达程度越高,那么其越有可能是一种疾病相关的DNA变异,来自斯坦福大学医学院的研究人员近期介绍了利用一种基于差异表达率的SNPs来筛选目标基因的新方法,这一研究成果公布在12月的《Genome Biology》杂志上。
领导这一研究的是在生物信息学研究方法颇有成就的Atul J Butte教授,第一作者是斯坦福大学医学院的陈荣博士(Rong Chen),其就读博士期间师从翁志萍教授(毕业于中国科技大学),主要进行结构基因组方面的研究,之后陈荣博士曾进入Amgen进行药物学方面的分析。
这篇文章中提到的新型SNPs指的是fitSNPs(functionally interpolating SNPs)。SNP是指单核苷酸多态性(single nucleotide polymorphism),即在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。
从全基因组关联研究(Genome-wide association study,GWAS)中筛选候选SNPs常常是基于其功能性注释,但这并不完全恰当,或者说不完全准确。研究人员通过分析来自基因表达综合数据库(Gene Expression Omnibus 简称GEO)的芯片研究数据,并计算了每个人类基因差异表达的观察频数(observed frequency)——研究人员称之为差异表达率(differential expression ratio,DER)。这些得到的数据表明在DER值和基本相关变异之间存在正相关关系。
在之前的研究中,有关基因表达和疾病相关变异之间的关联并没有得到十分确凿的证据,在这篇文章中,研究人员十分肯定的证明了这一点:比较于表达一致的基因,差异表达的基因的疾病相关性要高12倍,Butte教授表示,“作为一个研究范例,我们对I型糖尿病进行了分析,我们得到了系列fitSNPs,解析威康信托基金会病例控制协会(Wellcome Trust Case Control Consortium)I型糖尿病(T1DM)全基因组关联研究中的前7个位点,结果发现所有的T1DM基因,并预测了一个之前未进行注释位点的新基因。”
这项研究证明这种fitSNPs方法是一种系统区分候选SNPs和GWAS的有效工具,正如作者所说的,“fitSNPs成果区分了真正的疾病基因,在此类研究中将成为一种强有力的分析工具。”
(感谢原文作者陈荣对此文给予的支持)
(生物通:张迪)
附:
SNPs简介
单核苷酸多态性(single nucleotide polymorphism,SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。
SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起,也可由碱基的插入或缺失所致。但通常所说的SNP并不包括后两种情况。
理论上讲,SNP既可能是二等位多态性,也可能是3个或4个等位多态性,但实际上,后两者非常少见,几乎可以忽略。因此,通常所说的SNP都是二等位多态性的。这种变异可能是转换(C T,在其互补链上则为G A),也可能是颠换(C A,G T,C G,A T)。转换的发生率总是明显高于其它几种变异,具有转换型变异的SNP约占2/3,其它几种变异的发生几率相似。Wang等的研究也证明了这一点。转换的几率之所以高,可能是因为CpG二核苷酸上的胞嘧啶残基是人类基因组中最易发生突变的位点,其中大多数是甲基化的,可自发地脱去氨基而形成胸腺嘧啶。
在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在基因序列内,也有可能在基因以外的非编码序列上。总的来说,位于编码区内的SNP(coding SNP,cSNP)比较少,因为在外显子内,其变异率仅及周围序列的1/5.但它在遗传性疾病研究中却具有重要意义,因此cSNP的研究更受关注。
从对生物的遗传性状的影响上来看,cSNP又可分为2种:一种是同义cSNP(synonymous cSNP),即SNP所致的编码序列的改变并不影响其所翻译的蛋白质的氨基酸序列,突变碱基与未突变碱基的含义相同;另一种是非同义cSNP(non-synonymous cSNP),指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变,从而影响了蛋白质的功能。这种改变常是导致生物性状改变的直接原因。cSNP中约有一半为非同义cSNP。
先形成的SNP在人群中常有更高的频率,后形成的SNP所占的比率较低。各地各民族人群中特定SNP并非一定都存在,其所占比率也不尽相同,但大约有85%应是共通的。