Nanopore 长读长 RNA 测序在人类细胞系转录水平分析中的系统性基准研究:解锁转录组奥秘

【字体: 时间:2025年03月14日 来源:Nature Methods 36.1

编辑推荐:

  研究人员为评估长读长 RNA 测序技术研究转录表达的能力,开展 SG-NEx 项目,发现长读长 RNA 测序优势显著,为相关研究提供重要资源。

  在生命科学的微观世界里,基因就像一本本神秘的 “生命之书”,记录着生物的各种遗传信息。人类基因组中蕴含着转录超 20 万种 RNA 的指令,然而,同一基因往往能产生多种高度相似的 RNA 转录本(即替代异构体),精确测定这些转录本的表达水平成了一大难题。
短读长 RNA 测序(RNA-seq)虽被广泛应用,但存在诸多局限性。例如,基于 PCR 扩增的测序会引入偏差,导致不同外显子的测序覆盖度不均;短读长数据在处理复杂转录事件时也力不从心,难以准确区分相似的转录本。

为了突破这些困境,来自新加坡等多地研究机构的科研人员开展了一项重要研究,相关成果发表在《Nature Methods》杂志上。

研究人员开展了新加坡纳米孔表达(SG-NEx)项目,对 5 种不同的 RNA 测序方案进行了系统的基准测试和比较。他们选取了 7 种常见的人类细胞系,包括结肠癌细胞系(HCT116)、肝癌细胞系(HepG2)等,并使用多种技术手段对其进行深入研究。

在技术方法上,研究人员运用了多种 RNA 测序技术,如 Nanopore 长读长直接 RNA 测序、无扩增直接 cDNA 测序、PCR 扩增 cDNA 测序、PacBio IsoSeq 以及短读长 cDNA 测序。同时,他们还引入了多种已知浓度的内参 RNA(spike-in RNAs),并进行了转录组范围的 N6- 甲基腺苷(m6A)修饰分析。此外,研究团队开发了 nf-core/nanoseq 这一社区管理的流程,简化了数据处理和分析过程。

在研究结果方面:

  • 全面的长读长 RNA-seq 资源:SG-NEx 核心数据涵盖 7 种细胞系,通过多种测序方案进行了多次重复测序,还包含多种内参 RNA 和 m6A 修饰数据。此外,研究团队还对多个额外细胞系和组织进行了测序,为研究提供了丰富的数据资源。
  • nf-core/nanoseq 流程:该流程可进行质量控制、比对、转录本发现和定量、差异表达分析、RNA 融合检测以及 RNA 修饰检测等一系列操作,且各模块可灵活选择不同的现有方法,实现无缝集成。
  • 五种 RNA-seq 方案的比较:在通量方面,PCR 扩增的 cDNA 测序通量最高;读长上,PacBio IsoSeq 平均读长最长,直接 RNA 测序次之;覆盖度上,长读长方案在转录本的 5′和 3′端覆盖度更高,其中直接 RNA 测序在 3′端覆盖度尤为突出;在转录本表达估计方面,不同方案存在差异,如 PCR 扩增的 cDNA 测序对高表达基因的转录本扩增比例较大,而 PacBio IsoSeq 数据则显示较短转录本的表达有所缺失。
  • 基因表达估计的一致性:尽管不同测序方案存在差异,但在基因表达估计上具有较高的一致性。Nanopore 长读长 RNA-seq 数据的估计误差最低,与预期浓度的相关性更高,且与短读长 RNA-seq 数据在基因表达估计上高度相关,这表明两种数据可整合用于基因表达分析。
  • 长读长更准确估计主要异构体:相较于短读长 RNA-seq,Nanopore 长读长测序在估计转录本表达丰度方面表现更优,能更稳健地识别主要异构体。通过对模拟碎片化数据的分析发现,读长碎片化会影响转录本表达估计,使短读长 RNA-seq 数据对某些异构体的表达估计偏高。实验验证也证实了长读长特异性主要异构体的丰度更高。
  • SG-NEx 数据中的替代异构体表达:长读长 RNA-seq 数据中的全剪接匹配读段能够明确识别表达的替代异构体,研究发现不同细胞系中存在大量使用多种异构体的基因,常见的异构体差异包括外显子跳跃、替代启动子和替代最后外显子等,且异构体转换常涉及多个事件。
  • 新转录本的发现:研究人员利用长读长 RNA-seq 技术在 SG-NEx 数据中发现了 1531 个新的多外显子转录本候选,这些新转录本在重复元件上显著富集,且部分参与了细胞系特异性的异构体转换事件。
  • 融合转录本的发现与定量:通过对 6 种癌细胞系的研究,研究人员利用长读长 RNA-seq 数据鉴定出 106 个融合基因,其中 79 个已在先前研究或短读长数据中得到验证。长读长 RNA-seq 还能重建完整的融合转录本,平均每个融合基因可识别出 2 种由全剪接匹配读段支持的替代异构体。
  • m6A RNA 修饰分析:利用 Nanopore 技术直接测序 RNA,研究人员在 7 种核心细胞系中发现了 6337 个预测的 m6A 修饰位点,部分位点在不同细胞系中具有特异性,且在癌基因 MYC 上发现了大量 m6A 修饰,表明直接 RNA 测序可同时分析 RNA 表达和修饰。

研究结论和讨论部分指出,SG-NEx 项目提供了当前 RNA 测序技术的系统资源和基准数据集,突出了不同文库制备和测序方法的差异。研究表明长读长 RNA-seq 在识别主要异构体、发现新转录本、定量融合转录本以及鉴定 m6A 修饰等方面具有重要价值,为转录组分析提供了更深入的视角。尽管长读长 RNA-seq 技术存在测序错误率较高等问题,但通过适当的方法可以有效解决,且其在研究复杂转录表型方面具有独特优势。该研究为转录组学研究提供了全面的资源和参考,有助于推动相关领域的发展,为进一步理解基因表达调控和疾病发生机制奠定了坚实基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号