LocusMasterTE:整合长读长 RNA 测序,精准量化转座子元件表达的新突破

《Genome Biology》:LocusMasterTE: integrating long-read RNA sequencing improves locus-specific quantification of transposable element expression

【字体: 时间:2025年03月27日 来源:Genome Biology 10.1

编辑推荐:

  转座子元件(TEs)影响人类疾病,但其定量困难。香港大学研究人员开展 LocusMasterTE 方法研究,整合长、短读长 RNA-seq 数据提高 TEs 表达定量准确性,有助于深入了解 TEs 功能,为相关疾病研究提供新视角。

  转座子元件(Transposable elements,TEs)是基因组中的 “活跃分子”,它们在人类基因组中占据了半壁江山,却像隐藏在暗处的 “捣蛋鬼”,悄无声息地影响着人类健康。正常细胞中,TEs 被表观遗传机制紧紧管束着,可一旦进入癌细胞,就会 “兴风作浪”,引发各种问题。近年来,研究发现 TEs 在肿瘤发生等疾病过程中扮演着重要角色,但由于 TEs 序列的高度重复性,准确地对其进行定量分析就像在一团乱麻中找线头,困难重重。
为了攻克这一难题,香港大学李嘉诚医学院生物医学科学学院、香港科学园肿瘤与免疫学中心等机构的研究人员展开了深入研究,相关成果发表在《Genome Biology》上。

研究人员开发了一种名为 LocusMasterTE 的方法,旨在提高 TEs 表达定量的准确性。该方法整合了长读长和短读长 RNA 测序技术,巧妙地将长读长测序数据中的每百万转录本分数(transcript per million,TPM)值融入期望最大化(expectation–maximization,EM)算法,重新分配短读长测序中的多重映射读数,从而提升了基于短读长的 TEs 定量精度。

研究人员用到的关键技术方法包括:一是利用模拟短读长 RNA 测序数据对 LocusMasterTE 进行基准测试,以长读长数据为参考标准评估其准确性;二是使用来自不同细胞系的配对短读长和长读长 RNA 测序数据,以及 TCGA-COAD 队列样本,进行多方面分析;三是运用多种工具进行序列比对和定量分析,如 Minimap2、STAR、featureCounts、Talon 等。

研究结果如下:

  • 长读长 RNA 测序优势显著:长读长测序技术读长较长,能大幅降低转录组数据比对 TEs 时的多重映射读数比例。研究人员通过对人类结肠癌细胞系(HCT116)的研究发现,长读长与短读长在 TE 亚家族水平上相关性良好(Spearman 等级相关系数 ,span data-custom-copy-text="\(p2.2×10^{-16}\)" ),但在基因座特异性拷贝水平上差异较大(Spearman 等级相关系数 ,span data-custom-copy-text="\(p2.2×10^{-16}\)" )。此外,长读长测序所量化的 TEs 的差异度(% divergence)低于短读长测序(15.8% vs 18.7%;Wilcoxon 符号秩检验,span data-custom-copy-text="\(p2.2×10^{-16}\)" ),这表明长读长在定量年轻 TEs 方面更具优势123
  • LocusMasterTE 性能卓越:在模拟数据测试中,LocusMasterTE 在七种 TEs 定量方法中表现最佳,其精度达到 1.0,召回率为 0.86,F1 分数为 0.92 ,正确检测到的 TEs 数量最多且无假阳性检测。同时,该方法对年轻 TEs 的表达校正效果显著,与 Telescope 相比,LocusMasterTE 独特量化的 TEs 通常更年轻,且与长读长结果的相关性更高(Spearman 等级相关系数, ,span data-custom-copy-text="\(p2.2×10^{-16}\)"45
  • LocusMasterTE 量化结果与表观遗传数据契合:研究人员发现,LocusMasterTE 高度捕获的 TEs 与较少的抑制性组蛋白标记(H3K27me3、H3K9me3)富集相关,与更多的活性组蛋白标记(H3K4me3、H3K9ac、H3K27ac)富集相关,这表明 LocusMasterTE 的量化结果与独立的表观遗传数据更为一致6
  • RNA 编辑验证 LocusMasterTE 的可靠性:利用 TCGA-COAD 队列样本研究 RNA 编辑事件发现,LocusMasterTE 重新分配的读数所对应的 TEs 的 RNA 编辑谱与参考位点相似,且与编码基因的编辑水平差异明显,这说明 LocusMasterTE 重新分配的读数很可能来自 TEs 衍生的 RNA,验证了该方法的可靠性78

研究结论和讨论部分指出,LocusMasterTE 利用长读长测序优势,有效解决了短读长 RNA 测序中 TEs 定量的难题,在现有工具中实现了最精确的 TEs 定量,并能有效识别以前未检测到的活跃 TEs。尽管该方法存在依赖长读长数据、成本较高等局限性,但它为深入研究 TEs 在癌症和复杂疾病中的作用提供了有力工具,有助于揭示 TEs 的功能,为相关疾病的诊断、治疗和预防开辟新的道路,具有重要的科学意义和潜在的临床应用价值。

娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴f洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀

10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�

濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�

閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞e崬鍙嗘禍鍡毿掓禒搴n儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�

娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号

    閻㈢喓澧块柅姘辩翱瑜扳晜甯归懡锟� • 多功能纳米平台:开启肿瘤免疫治疗新篇章 • 《Cell》亚洲免疫细胞多样性研究:解锁健康与疾病的遗传密码