刘小乐等:分析CRISPR/Cas9敲除的新算法

【字体: 时间:2014年12月19日 来源:生物通

编辑推荐:

  2014年12月5日,华人女学者、哈佛大学公共卫生学院Dana-Farber癌症研究所刘小乐(X Shirley Liu)博士带领的研究小组,在国际著名学术期刊《Genome Biology》发表了一项最新生物信息学研究成果。在这项研究中,研究人员开发出一种统计方法,被称为基于模型的全基因组CRISPR/Cas9敲除分析(MAGeCK),来确定来自于CRISPR/Cas9筛选的必需sgRNA、基因和通路。

  

生物通报道:2014年12月5日,华人女学者、哈佛大学公共卫生学院Dana-Farber癌症研究所刘小乐(X Shirley Liu)博士带领的研究小组,在国际著名学术期刊《Genome Biology》发表了一项最新生物信息学研究成果,题为“MAGeCK enables robust identification of essential genes from genome-scale CRISPR/Cas9 knockout screens”。在这项研究中,研究人员开发出一种统计方法,被称为基于模型的全基因组CRISPR/Cas9敲除分析(MAGeCK),来确定来自于CRISPR/Cas9筛选的必需sgRNA、基因和通路。

本文通讯作者刘小乐博士,青年时代就读于天津南开中学, 1992 年考入北京大学生物系。1994 年转学到美国史密斯女子学院双修生物化学和计算机科学, 三年后以最高拉丁荣誉毕业。2002 年于斯坦福大学取得生物医学信息学博士和计算机科学辅修博士学位后, 被直接聘为哈佛大学终身制助理教授。她目前担任哈佛大学公共卫生学院生物统计与计算生物学系的终身正教授、Dana-Farber 肿瘤研究所功能性癌症表观遗传组学中心主任和同济大学生物信息学系教授并****讲座教授。研究工作侧重于基因调控机制的生物信息和计算机生物学研究。发表论文多篇,其中19篇在Nature/Cell系列期刊。

成簇的规律间隔短回文重复序列(CRISPR)/Cas9系统是用于哺乳动物基因组编辑的一种全新方法。在这个系统中,单导向RNAs(sgRNAs)指导Cas9核酸酶诱导DNA双链在靶向基因组区域断裂。sgRNAs的5’端包括大约20nt的核苷酸序列,与靶序列是互补的。当双链断裂被非同源末端连接(NHEJ)修复时,插入和缺乏就会高频率地发生,从而有效地敲除靶基因组位点。

最近开发的一种慢病毒传递方式,已经能够创建基因组范围的CRISPR/Cas9敲除(或GeCKO)文库,靶定100到10000个基因。这些文库可让我们以一种划算的方式,在哺乳动物细胞系上进行阴性和阳性筛选。在CRISPR/Cas9基因敲除筛选中,每个基因被几个sgRNA靶定,携带不同基因敲除的突变体库,可以通过高通量测序得以解决。

与其他功能缺失的筛选技术(如RNAi)相比,全基因组CRISPR/Cas9敲除技术显示出更大的希望,因为它能够在DNA水平敲除基因。然而,这些筛选所产生的数据,给计算分析提出了几大挑战。首先,研究往往没有重复或者仅重复几次,这必然需要一种适当的统计模型来评估读取数据的方差,并评估处理样本和对照样本之间对比的统计学意义。所观察到的sgRNA丰度,在阴性和阳性筛选实验中都是高度可变的,与一个泊松抽样模型相比,它们都是过度分散的。(这种过度分散类似于其他高通量测序实验的观察结果,如RNA-seq

第二,因为靶定相同基因的不同sgRNA有不同的特异性和敲除效率,因此需要一种强大的方法,在聚集来自于多个sgRNA的信息时能够把这些因素考虑在内。第三,根据不同的筛选文库和研究设计,CRISPR/Cas9敲除筛选实验的读取数据分布是不同的,因为阳性选择往往产生一些sgRNA(总序列读取占支配地位)。这需要对序列读取进行强大的归一化。

现有的几种算法,虽然不是专门为CRISPR/Cas9敲除筛选设计,但是可以用来明确识别选择的sgRNA或基因。例如,edgeR、DESeq、baySeq和NBPSeq是常用于差异性RNA-seq表达分析的算法。这些算法能够评估CRISPR/Cas9敲除筛选中点击数的统计学意义,尽管只是在sgRNA水平。

一些算法——旨在排列基因组规模短干扰RNA(siRNA)或短发夹RNA(shRNA)筛选数据中的基因,也可以用于CRISPR/Cas9敲除筛选数据,包括RNAi Gene Enrichment Ranking (RIGER)和Redundant siRNA Activity (RSA)。然而,这些方法主要设计用以确定大多来自于寡核苷酸条码微阵列数据的必需基因(essential gene),一种新的算法必须优先考虑sgRNA,以及来自高通量测序数据的基因和通路。

在这项研究中,研究人员开发出一种统计方法,被称为基于模型的全基因组CRISPR/Cas9敲除分析(MAGeCK),来确定来自于CRISPR/Cas9筛选的必需sgRNA、基因和通路。研究之所以用“essential”这个术语,指的是阴性或阳性选择的sgRNAs、基因或通路。

与现有计算方法相比,MAGeCK的优势在于,它能控制错误发现率,而且它具有很高的灵敏度。MAGeCK的结果也对不同的测序深度和每个基因的sgRNA数目,有很强的稳健性。此外,使用公共CRISPR/Cas9敲除筛选文库,研究人员证明,MAGeCK能够同时进行阳性和阴性选择筛选,并确定具有生物学意义及细胞类型特异性的必需基因和通路。

(生物通:王英)

延伸阅读:Science综述:CRISPR-Cas9系统的历史和未来

生物通推荐原文摘要:
MAGeCK enables robust identification of essential genes from genome-scale CRISPR/Cas9 knockout screens
Abstract: We propose the Model-based Analysis of Genome-wide CRISPR/Cas9 Knockout (MAGeCK) method for prioritizing single-guide RNAs, genes and pathways in genome-scale CRISPR/Cas9 knockout screens. MAGeCK demonstrates better performance compared with existing methods, identifies both positively- and negatively-selected genes simultaneously, and reports robust results across different experimental conditions. Using public datasets, MAGeCK identified novel essential genes and pathways, including EGFR in vemurafenib treated A375 cells harboring a BRAF mutation. MAGeCK also detected cell-type specific essential genes including BCR and ABL1 in the KBM7 cells bearing a BCR-ABL fusion, and IGF1R in the HL-60 cells, which depends on the insulin signaling pathway for proliferation.

 

濠电偞鍨堕幐鎼侇敄閸緷褰掑炊閳规儳浜鹃柣鐔煎亰濡插湱鈧鎸哥€涒晝鈧潧銈搁弫鍌炴倷椤掍焦鐦庨梺璇插缁嬫帡宕濋幒妤€绀夐柣鏃傚帶杩濇繝鐢靛Т濞茬娀宕戦幘鎰佹僵鐎规洖娲ㄩ悾铏圭磽閸屾瑧顦︽俊顐g矒瀹曟洟顢旈崨顖f祫闂佹寧绻傞悧鎾澄熺€n喗鐓欐繛鑼额嚙楠炴﹢鏌曢崶銊ュ摵鐎殿噮鍓熼獮宥夘敊閻e本娈搁梻浣藉亹閻℃棃宕归搹顐f珷闁秆勵殕椤ュ牓鏌涢幘鑼槮濞寸媭鍨堕弻鏇㈠幢濡ゅ﹤鍓遍柣銏╁灡婢瑰棗危閹版澘顫呴柣娆屽亾婵炲眰鍊曢湁闁挎繂妫欑粈瀣煃瑜滈崜姘┍閾忚宕查柛鎰ㄦ櫇椤╃兘鏌ㄥ┑鍡欏ⅵ婵☆垰顑夐弻娑㈠箳閹寸儐妫¢梺璇叉唉婵倗绮氶柆宥呯妞ゆ挾濮烽鎺楁⒑鐠団€虫灁闁告柨楠搁埢鎾诲箣閿旇棄娈ュ銈嗙墬缁矂鍩涢弽顓熺厱婵炲棙鍔曢悘鈺傤殽閻愬弶鍠橀柟顖氱Ч瀵噣宕掑Δ浣规珒

10x Genomics闂備礁鎼崐鐟邦熆濮椻偓楠炴牠鈥斿〒濯爄um HD 闁诲孩顔栭崰鎺楀磻閹剧粯鐓曟慨妯煎帶閻忕姷鈧娲滈崰鎾舵閹烘骞㈡慨姗嗗墮婵啴姊洪崨濠傜瑨婵☆偅绮嶉妵鏃堝箹娴g懓浠㈤梺鎼炲劗閺呮粓鎮鹃柆宥嗙厱闊洤顑呮慨鈧┑鐐存綑濡粓濡甸幇鏉垮嵆闁绘ḿ鏁搁悡浣虹磽娴e憡婀版俊鐐舵铻為柛褎顨呯粈鍡涙煕閳╁啞缂氶柍褜鍏涚划娆撳极瀹ュ鏅搁柨鐕傛嫹

婵犵數鍋涘Λ搴ㄥ垂閼测晜宕查悗锝庡亞閳绘棃鎮楅敐搴″箺缂佷胶娅墂ist闂備線娼уΛ妤呮晝閿濆洨绠斿鑸靛姇濡ɑ銇勯幘璺轰粶缂傚秳绶氶弻娑㈠冀閵娧冣拡濠电偛鐗婇崢顥窱SPR缂傚倷鐒︾粙鎺楁儎椤栫偛鐒垫い鎺嗗亾妞わ缚鍗抽幃褔宕妷銈嗗媰闂侀€炲苯澧村┑鈥愁嚟閳ь剨缍嗛崜姘跺汲閳哄懏鍊垫繛鎴炵懃婵啴鏌涢弮鎾村

闂備礁鎲¢〃鍡椕哄⿰鍛灊闊洦绋掗崵鍕煟閹邦剦鍤熼柕鍫熸尦楠炴牠寮堕幋鐘殿唶闂佸憡鐟ュΛ婵嗩潖婵犳艾惟闁靛绲煎ù鐑芥煟閻樿京鍔嶇憸鏉垮暣閹儵鏁撻敓锟� - 婵犵數鍎戠徊钘夌暦椤掑嫬鐭楅柛鈩冡缚椤╂煡鏌涢埄鍐惧毀闁圭儤鎸鹃々鐑藉箹鏉堝墽绉甸柛搴㈠灥閳藉骞橀姘濠电偞鍨堕幖鈺傜濠婂啰鏆﹂柣鏃囨绾惧ジ鏌涢埄鍐闁告梹甯¢幃妤呭捶椤撶偘妲愰梺缁樼⊕閻熝囧箯鐎n喖绠查柟浼存涧閹線姊洪崨濠傜濠⒀勵殜瀵娊鎮㈤悡搴n唹濡炪倖鏌ㄩ悘婵堢玻濞戙垺鐓欓悹銊ヮ槸閸婂鎮烽姀銈嗙厱婵炲棙锚閻忋儲銇勯銏╁剶鐎规洜濞€瀵粙顢栭锝呮诞鐎殿喗鎮傞弫鎾绘晸閿燂拷

濠电偞鍨堕幐鎼侇敄閸緷褰掑炊椤掆偓杩濇繝鐢靛Т鐎氼噣鎯屾惔銊︾厾鐎规洖娲ゆ禒婊堟煕閻愬瓨灏﹂柟钘夊€婚埀顒婄秵閸撴岸顢旈妶澶嬪仯闁规壋鏅涙俊铏圭磼閵娧冾暭闁瑰嘲鎳庨オ浼村礃閵娧€鍋撴繝姘厸閻庯綆鍋勬慨鍫ユ煛瀹€鈧崰搴ㄥ煝閺冨牆鍗抽柣妯挎珪濮e嫰鏌f惔銏⑩姇闁告梹甯″畷婵嬫偄閻撳宫銉╂煥閻曞倹瀚�

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号