高冠军:CRISPR破解基因组“暗物质”功能之谜

【字体: 时间:2016年11月11日 来源:生物通

编辑推荐:

  “依我拙见,如果要破解lncRNAs的谜题,首先需要突破针对lncRNAs研究方法。如果能有新的鉴定与lncRNAs相互作用蛋白的生物化学方法,可以高效专一的鉴定出与lncRNAs特异性作用的蛋白质,将会给lncRNAs的研究带来惊喜……”

  

生物通报道:基因组“暗物质”已经从所谓的“垃圾”DNA变成了炙手可热的研究领域,揭示它们的奥秘对于破解人类遗传谜题,研发更好的疾病治疗方法具有重要意义。

清华大学生命科学学院高冠军研究组将优化后的CRISPR技术运用于lncRNA活体功能研究领域,以基因组强净化的遗传学鼻祖模式生物——果蝇为代表,通过高通量遗传动物模型的建立,系统阐述了长链非编码RNA(lncRNA)在精子发生过程中的重要作用,为揭示“暗物质lncRNA”具有重要生物学功能提供了大量的遗传学证据。

这一研究成果公布在Genome Research杂志上,领导研究的是清华大学生命科学学院PI高冠军博士,其研究组实验室在国际上率先建立的CRISPR与phiC31重组酶相结合的高效果蝇基因打靶系统(knock-out和knock-in),并利用这一系统取得了不少重要发现。为了进一步了解最新这项研究,生物通特联系了高博士,就读者感兴趣的问题请教了他。

研究论文:

本世纪初,伴随高通量测序技术发展,构成真核生物基因组中的大量“暗物质”——lncRNA被鉴定出来,且在睾丸和脑组织中呈现高度特异性表达,暗示lncRNA的功能机制在精子发生与神经调控两个基础生命学过程具有代表性。

高冠军研究小组选择基因强净化的模式生物果蝇,系统性鉴定了128个睾丸特异性表达的lncRNA。并运用优化后的CRISPR技术建立了105个lncRNA基因敲除体。通过对雄性果蝇育性测试、精子发生、发育、活力及核形态等进行观察分析,研究人员发现近1/3的lncRNA基因的缺失会导致精子发育异常甚至完全不育。

同时部分测试的lncRNAs敲除果蝇均可通过易位转基因得以完全或部分修复,表明这些lncRNAs主要以反式(trans)发挥作用。基因表达谱显示,大部分功能性lncRNAs在精子发生中调控全局基因的表达。进化分析表明,与编码基因相比,lncRNAs演化更快,且具有更大功能重要性的lncRNAs具有较高的序列保守性,暗示它们处于不断的进化选择之下。

另外,与蛋白编码基因的开关调控作用不同,lncRNA可能多通过微调的方式调控全局基因表达,精心策划雄性生殖细胞分化。总之,该研究弥补了大量功能性lncRNA在动物活体水平所缺乏遗传学证据的空白,开启了lncRNA所传递的生命信息研究的大门。

生物通:基因组暗物质虽然逐渐摆脱了“垃圾DNA”的名号,但依然是说不清,道不明,要阐明这些元件的作用,您的研究组采用了什么分析思路?所得到的结果是否与您预期的相符?

高博士:传统的研究认为,编码人类蛋白质的基因只有2~3万个,且只占全基因组的占2%左右。而超过95%的人类基因组并不编码蛋白质基因,而是构成了生命“暗物质”——非编码RNA。近年来,越来越多的具有生物学功能的非编码RNA被鉴定出来。然而,相对于数目庞大的非编码RNA(包括大量的长链非编码RNA,通常>200nt)来讲,这只是冰山一角。

本项目的目的就是通过高通量遗传动物模型的建立,来系统阐述了长链非编码RNA(lncRNA)在生物进化中的作用,为揭示“暗物质lncRNA”是否具有重要生物学功能提供遗传学证据。

与蛋白质编码基因不同,lncRNAs表达丰度较低,通常会与蛋白质形成高级结构发挥作用,探讨lncRNAs功能可用 gain/loss of function 策略,过表达或沉默lncRNAs后观察表型。但目前广泛应用于lncRNAs研究的RNAi knock down技术只能部分沉默基因,所以用RNAi 敲低lncRNAs,其表型可能会非常微弱以致无法观察表型。另外,相较于蛋白编码基因,lncRNAs的保守性较差,导致lncRNAs无法像蛋白编码基因一样来根据序列推测其保守的功能结构域,再针对该结构域进行knock down,这在很大程度上降低了lncRNAs knock down的效果。

同时,由于lncRNAs被发现在睾丸和脑组织中呈现高度特异性表达,暗示lncRNAs的功能机制在精子发生与神经调控两个基础生命学过程具有代表性。然而,目前未有针对精子发生过程lncRNAs的大规模研究报道。

基于以上两方面考虑,本实验室研究lncRNAs功能的基本思路是:首先,通过生物信息学预测和Flybase已有注释,系统性鉴定出在果蝇睾丸组织几乎所有特异性表达的lncRNAs。其次,我们对CRISPR技术进行了优化,以适合lncRNAs功能研究。运用优化后的CRISPR技术,我们建立起100个左右lncRNAs基因完全敲除的果蝇突变株。之后,通过对突变体雄性果蝇育性测试、精子发生、发育、活力及核形态等进行观察分析,我们筛选出在果蝇精子发生中具有重要功能的lncRNAs。最后,通过高通量RNA测序和进化分析,我们对lncRNAs可能的作用机制进行了研究。

研究结果与我们的预测基本一致,有近1/3的lncRNAs基因缺失会导致精子发育异常甚至完全不育。该研究弥补了大量功能性lncRNA在动物活体水平所缺乏遗传学证据的空白,开启了lncRNA所传递的生命信息研究的大门。

生物通:果蝇基因敲除从基因打靶,到ZFN、TALEN,再到CRISPR/Cas9技术,发生了不少变化,您为何选择了CRISPR/Cas9?在实验分析过程中是否也遇到了一些难题,您是如何解决的呢?

高博士:果蝇基因敲除的传统方法——基因打靶,包括ends-in与ends-out均基于φC31 整合酶系统介导的位点特异性交换,依赖于生物体内自身的DNA修复系统,将基因组上目的基因的靶位点序列置换为供体质粒上的序列。然而,传统基因打靶技术流程复杂,周期长,需耗费大量人力与时间,不适合大规模筛选使用。

锌指核酸酶(ZFN)与转录激活因子样效应物核酸酶(TALEN)用于基因打靶的局限在于,针对每一个候选基因,均需构建和筛选针对该基因的特异性结合蛋白,从而限制了该方法运用于大规模基因敲除。因此,在模式动物水平,以基因敲除方法大规模研究lncRNAs的功能,需要快速简洁的规模化基因敲除方法介入。

2013年1月以来,一种新的基因编辑技术CRISPR/Cas引起了广泛关注。CRISPR是在细菌及古细菌中广泛存在的免疫系统。针对特定基因,可以通过人工构建两个RNA的嵌合体构成定向RNA,模拟crRNA与tracrRNA特异识别基因序列,再通过人工表达Cas9蛋白对特定DNA序列进行切割产生DNA双链损伤,在修复时引入突变或移码即可得到目标基因的敲除突变体。CRISPR系统的迅速发展,极大地减少了基因敲除所需的工作量和周期,使得通过大规模敲除而研究lncRNAs的功能机制成为可能。因此,CRISPR基因编辑是目前解决lncRNAs功能的最强有力的方法之一。

生物通:研究分析了上百个lncRNAs,其中是否有哪些lncRNAs对精子功能,生育生殖产生重要影响,导致果蝇完全不育的?

高博士:我们系统性的对105个lncRNAs果蝇突变株进行了表型鉴定。通过定量育性测试、睾丸组织活体压片观察、鬼笔环肽染色以及组蛋白-鱼精蛋白标记实验,我们发现33个lncRNAs(1/3)在精子发生过程的减数分裂后期发挥功能。其中,lncRNAs CR44456敲除导致雄性果蝇完全不育,对果蝇的生殖发育产生了重要影响。

生物通:部分测试的lncRNAs敲除果蝇均可通过易位转基因得以完全或部分修复,表明这些lncRNAs主要以反式(trans)发挥作用,这是指什么?

高博士:已有研究表明,lncRNAs的作用方式可分为in cis与in trans两种。in cis的作用方式是指lncRNAs对同位点或邻近位点的基因起着调控作用,该种lncRNAs的表达通常与邻近蛋白编码基因的表达趋同。in trans的作用方式是指lncRNAs可对基因表达进行远距离调控,比如许多lncRNAs可作为染色质重塑复合体的向导或脚手架,在转录水平调控基因表达。

为验证参与果蝇精子发生的lncRNAs是否可以通过trans作用而行驶功能,我们随机选取了6个lncRNAs进行转基因补偿实验。具体操作为,首先克隆出用于补偿的lncRNAs启动子以及cDNA,通过多克隆位点装入带有attB元件的表达载体。随后将纯化后质粒注射与lncRNAs所在染色体不同的另一条染色体上带有attP元件与phiC31重组酶的果蝇株当中,由此通过phiC31重组酶介导attP-attB交换反应,可以将lncRNAs转基因补偿到与lncRNAs敲除位置不同的染色体上。

结果表明,将lncRNAstrans补偿到与lncRNAs基因位置不同的另一条染色体上可以恢复lncRNAs突变后的表型,说明参与果蝇精子发生的lncRNAs更多的是通过trans的作用在减数分裂后期发挥功能。

生物通:长链非编码RNAs最早出现在生物基因组中至少可以追溯到9000万年前,这是大多数有胎盘类哺乳动物的共同祖先出现的时候,这一点与您的研究中,精子lncRNAs的演化进程是否一致?这表明了什么?

高博士:长链非编码RNAs的起源是一个比较复杂的问题。随着高通量测序技术的发展,越来越多的非编码RNAs(包括长链非编码RNA,通常>200nt)在各种真核生物中被鉴定出来,其中包括很多表达丰度很低的非编码RNAs。随着生物的进化,非编码RNA在基因组中的比例也不断增加,如人类基因组中95%以上为非编码RNA。关于其功能分析方面,现在鉴定的为数不多的非编码RNA主要是参与基因表达的调控。然而,非编码RNA不是真核生物的“专利”,在各种原核生物包括细菌和真菌中都存在各种各样的非编码RNA,它们通过碱基配对识别靶标mRNA, 在转录后调节基因的表达, 是细菌代谢、毒力和适应环境压力的重要调节因子。因而关于其起源与胎盘类哺乳动物出现没有关系。

中心法则中遗传信息传递的每一个过程都受到严格的调控。DNA分子可以转录成不同形式的RNA分子。不稳定的mRNA分子可以与翻译机器结合而翻译成功能性的蛋白质,而这些DNA分子称为蛋白质编码基因。同样,有些DNA分子也可以转录成特定的能折叠成稳定茎环结构的RNA分子,而这些分子不易与蛋白质翻译机器结合,因而不能翻译成蛋白质,这类称为非编码基因。而正因为这些非编码RNA不能被翻译成蛋白且又具备稳定茎环结构,因而部分分子又构成了基因表达调控中行使重要功能的一类分子。

本研究中,我们探索了所有lncRNAs的序列保守性,并将lncRNAs的保守性与蛋白编码基因对比。与其他研究一致,我们发现古老的lncRNAs保守性高于年轻的lncRNAs。总体来看,与蛋白编码基因相比,lncRNAs的进化明显更快。另外,睾丸组织偏好性的DNA编码序列保守性低于整体的DNA编码序列,该结果与之前研究相符。有趣的是,本研究中果蝇敲除株具有表型的lncRNAs其序列保守性高于果蝇敲除株无表型的lncRNAs,表明具有重要功能的lncRNAs进化更慢。以上进化分析的结果表明,在果蝇精子发生中有功能的lncRNAs进化慢于无功能的lncRNAs,而蛋白编码基因的进化又慢于lncRNAs的整体进化,暗示lncRNAs在进化中可能处于向有功能因子转变的中间体的地位。

生物通:下一步您的研究组将进行哪些方面的研究,不知是否方便透露?

高博士:下一步,我们将结合生化、遗传及细胞学手段研究若干重要功能lncRNAs的靶基因以及它们的作用机制。对于若干目前已筛选出的具有严重表型(包括雄性不育)的lncRNAs,我们将通过ChIRP-seq、RNA-seq和改良的RNA pull-down等技术相结合,在全基因组范围内找到lncRNAs的靶DNA序列、靶标RNA和互作蛋白。然后通过生化手段如RNA免疫沉淀RIP,可在体内验证lncRNAs与其靶蛋白的相互作用。通过遗传学手段建立lncRNAs靶基因的突变株,分析lncRNAs与靶基因的遗传关系。通过细胞学手段,RNA原位杂交FISH可定位lncRNAs,免疫荧光可定位lncRNAs的靶蛋白,在野生型与lncRNAs敲除株、功能补偿株及转基因补偿株中分析lncRNAs与其靶基因的共定位关系。同样可通过phiC31介导的attP/attB补偿实验探索lncRNAs基因内各元件以及功能性结构域的功能。也通过染色质构象捕获hiC技术,可观察lncRNAs突变后,是否会对靶标位点处的染色质高级结构产生影响等。通过多种现代分子生物学技术手段的整合,从多角度挖掘若干具有重要表型的lncRNAs参与睾丸组织精子发生的调控机制。

生物通:现如今,基因组暗物质吸引了全球越来越多的实验室和科学家,作为这一领域的前沿科学家,您认为未来要破解这个谜题,最需要哪些方面的研究突破?

高博士:依我拙见,如果要破解lncRNAs的谜题,首先需要突破针对lncRNAs研究方法。如果能有新的鉴定与lncRNAs相互作用蛋白的生物化学方法,可以高效专一的鉴定出与lncRNAs特异性作用的蛋白质,将会给lncRNAs的研究带来惊喜。另外,由于lncRNAs的一级序列的保守性很低,如果能有生物信息学方法的突破,从高级结构上找到不同物种之间lncRNAs的功能同源物,将会给lncRNAs的研究带来曙光。

原文摘要:

Critical roles of long noncoding RNAs in Drosophila spermatogenesis

Long noncoding RNAs (lncRNAs), a recently discovered class of cellular RNAs, play important roles in the regulation of many cellular developmental processes. Although lncRNAs have been systematically identified in various systems, most of them have not been functionally characterized in vivo in animal models. In this study, we identified 128 testis-specific Drosophila lncRNAs and knocked out 105 of them using an optimized three-component CRISPR/Cas9 system. Among the lncRNA knockouts, 33 (31%) exhibited a partial or complete loss of male fertility, accompanied by visual developmental defects in late spermatogenesis. In addition, six knockouts were fully or partially rescued by transgenes in a trans configuration, indicating that those lncRNAs primarily work in trans. Furthermore, gene expression profiles for five lncRNA mutants revealed that testis-specific lncRNAs regulate global gene expression, orchestrating late male germ cell differentiation. Compared with coding genes, the testis-specific lncRNAs evolved much faster. Moreover, lncRNAs of greater functional importance exhibited higher sequence conservation, suggesting that they are under constant evolutionary selection. Collectively, our results reveal critical functions of rapidly evolving testis-specific lncRNAs in late Drosophila spermatogenesis.

作者简介:

高冠军,清华大学生命科学学院,教授,博士生导师。2005年博士毕业于浙江大学,2006年至2011年在美国国立卫生研究院(美国国家癌症研究所NCI)从事博士后和Research Fellow,2011年至今就职于清华大学生命科学学院。该实验室是世界上最早探索CRISPR基因编辑技术的几个实验室之一,曾于2013年初和2014年分别在国际遗传学经典期刊Genetics和G3•Genes|Genomes|Genetics连续发表了一系列方法学论文,引用达200多次;建立的基因编辑方法及相应的配套试剂已广泛被世界上很多实验室使用。作者曾出任2015年国际果蝇大会(美国)•果蝇生物技术与资源分会Co-Chair。实验室主要运用遗传学方法建立的动物模型,系统的研究染色质表观遗传因子(如非编码RNA及组蛋白修饰等)在发育及疾病方面的作用机制。研究成果多次发表在Nature、PNAS、Genetics、G3和EMBO J等国际学术期刊。

 

 

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号