《Scientific Data》:Chromosome-scale genome assembly and annotation of Huzhang (Reynoutria japonica)
编辑推荐:
研究人员为完善虎杖(Reynoutria japonica)基因组,综合多种测序技术,成功组装出高质量基因组,助力相关研究。
在植物的奇妙世界里,虎杖(
Reynoutria japonica)是一种颇为独特的存在。它在欧洲被视为极具侵略性的外来入侵物种,肆意生长,对当地生态环境造成了极大的破坏;然而,在我国秦巴山区,虎杖却有着别样的价值,它既是传统的药用植物,又可当作蔬菜食用,是当地人生活中不可或缺的一部分。
随着生命科学研究的不断深入,基因组测序技术成为了解开植物奥秘的关键钥匙。过去的五年间,测序技术飞速发展,众多药用植物的基因组被成功解析,像艾草(Artemisia argyi)、铁皮石斛(Dendrobium officinale)等。但虎杖的基因组研究却遇到了难题,此前利用二代短读长 Illumina 测序技术得到的虎杖基因组草图并不完善。由于虎杖基因组中存在大量的转座元件(TEs),这些 “捣乱分子” 使得基因组的从头组装困难重重,出现了许多缺口和错误,严重影响了对虎杖基因组的准确认知。为了更深入地了解虎杖,挖掘其潜在价值,来自华中农业大学、三峡大学、湖北医药学院等多家国内研究机构的研究人员联合开展了一项研究,致力于构建高质量的虎杖基因组。最终,他们的研究成果发表在《Scientific Data》上,为植物研究领域带来了新的突破。
在这项研究中,研究人员运用了多种先进的关键技术方法。样本方面,他们采集了种植于湖北十堰秦巴山区的虎杖植株新鲜幼叶及其他多种组织。在测序技术上,综合使用了 Illumina 测序、高通量染色体构象捕获(Hi-C)测序和单分子实时(SMRT)测序技术。Illumina 测序可获得大量短读长数据,Hi-C 测序用于染色体构建,SMRT 测序则凭借长读长优势跨越复杂区域,三者相辅相成,为高质量基因组的组装奠定了坚实基础。
下面来详细看看研究结果:
- 基因组测序与评估:研究人员对虎杖基因组进行全面测序,共获得 276.14 Gb(~84× 覆盖度)的 Illumina 数据、322.36 Gb(~98× 覆盖度)的 Hi-C 数据、252.45 Gb(~77× 覆盖度)的 PacBio 数据以及 123.30 Gb 的 RNA 数据。通过 K-mer 分析初步评估基因组大小约为 2,813 Mb。利用 Canu v2.1.1 对 PacBio 数据进行初步组装,再经 Arrow 和 Pilon 软件分别用长读长和短读长数据进行优化,之后借助 Hi-C 数据构建染色体。最终组装得到的虎杖基因组大小约为 3.30 Gb,contig N50 达到 1.39 Mb,99.22% 的序列成功锚定到 22 条假染色体上,BUSCO 评估显示基因组完整性高达 95.20%,这些数据充分表明所组装的基因组质量极高。
- 重复序列与基因注释:在重复序列注释方面,研究人员采用同源比对和从头预测相结合的策略,发现虎杖基因组中 74.79% 的序列为重复序列,其中长末端重复序列(LTR)占比最大。对于基因注释,研究人员系统地对非编码基因和蛋白质编码基因进行了预测。共注释出 14,788 个非编码 RNA,包括 339 个 miRNA、7,508 个 tRNA 等;通过多种预测方法整合,鉴定出 68,646 个蛋白质编码基因,并且对这些基因进行了功能注释,其中 65,774 个基因在至少一个公共数据库中获得了功能注释。
这项研究成果意义重大。从基因组层面来看,高质量的染色体级虎杖基因组组装,填补了此前研究的空白,为虎杖基因组的深入研究提供了精准的参考。在比较基因组学领域,该基因组资源为蓼属植物的研究搭建了重要平台,有助于深入探究相关物种间的进化关系。从应用角度出发,对于虎杖的药用价值挖掘以及入侵性研究提供了有力的基因数据支持,未来可基于此开展针对性的研究,为合理利用虎杖资源、有效防控其入侵提供理论依据。同时,该研究成果也为其他植物的基因组研究提供了宝贵的经验和借鉴,推动了整个植物基因组学领域的发展。
涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒
10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�
娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功
鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�
涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�