高保真长读测序解锁泌尿生殖系统肿瘤基因组密码:洞察染色体畸变新视角

《Scientific Data》:Genome assembly resources of genitourinary cancers for chromosomal aberration at the single nucleotide level

【字体: 时间:2025年04月02日 来源:Scientific Data 5.8

编辑推荐:

  为解决短读测序技术难以检测前列腺腺癌和肾细胞癌中染色体水平宏观进化变化的问题,研究人员开展了泌尿生殖系统肿瘤基因组组装研究。他们对 6 种细胞系测序,获得高质量基因组组装等数据,这有助于理解癌症基因组不稳定性和染色体畸变。

  在癌症研究的广阔领域中,前列腺癌(PC)和肾细胞癌(RCC)一直是备受关注的焦点。这两种癌症在全球范围内的发病率不容小觑,分别占据癌症总发病率的 7.3% 和 2.2%。长期以来,科研人员致力于从基因组层面剖析它们,期望能区分出 “侵袭性变体” 和进展缓慢的类型,而染色体畸变被发现对这两种癌症的恶性转化和进展起着关键作用。在 PC 中,TMPRSS2-ERG 融合(21q)是常见的基因组突变,其进展常伴随着 TP53、CDKN1B 和 PTEN 等肿瘤抑制基因(TSGs)的连续缺失,主要由染色体重排(chromoplexy)驱动。而在 RCC 中,近 90% 的透明细胞 RCC 会出现 3 号染色体短臂缺失,这是染色体碎裂(chromothripsis)的典型表现,会导致 VHL、PBRM1 等关键 TSGs 所在区域的杂合性缺失(LOH) 。
然而,传统的短读测序技术在面对这些复杂的染色体变化时却显得力不从心。由于其读长较短,难以覆盖异常染色体的完整结构,许多重要的宏观进化改变就这样被遗漏,成为基因组研究中的 “暗物质”。为了填补这一空白,来自韩国延世大学医学院泌尿外科、韩国国家癌症中心泌尿癌症中心等机构的研究人员踏上了探索之旅。他们的研究成果发表在《Scientific Data》上,为我们深入了解泌尿生殖系统肿瘤的基因组奥秘带来了新的曙光。

研究人员采用了一系列先进的技术方法来开展研究。在样本选择上,他们从韩国细胞系库(KCLB)获取了 6 种泌尿生殖系统肿瘤细胞系,包括 3 种前列腺癌细胞系(PC-3、DU 145、LNCaP)、2 种肾癌细胞系(Caki-1、SNU-1272)和 1 种良性肾肿瘤细胞系(HK-2) 。实验技术方面,利用太平洋生物科学公司的高保真(HiFi)长读测序技术,对这些细胞系进行测序。该技术不仅能提供高精度、足够长的读数(~Q30 和 10 - 20 kb),还能获取 5 - 甲基胞嘧啶(5mC)信息。之后,通过多种生物信息学工具对测序数据进行分析,如用 KMC 和 GenomeScope2 分析 k-mer 覆盖度,用 Hifiasm 进行从头基因组组装等。

下面来看具体的研究结果:
濡ょ姷鍋涢悘婵嬪箟閿燂拷 免费获取QuantiNova定量试剂试用资格

  1. 细胞系信息与测序数据:详细介绍了 6 种细胞系的来源、生物学特性等信息。通过 HiFi 测序,每个细胞系都获得了 78 - 92 Gb(5.4M - 6.5 M reads;25 - 30× 人类基因组大小)的测序数据,平均读长在 13,949 - 15,260 bp,碱基质量值达到 Q31 - Q33。
  2. 基因组组装:利用 Hifiasm 将 HiFi 读数组装成部分单倍型解析的重叠群(contigs)。12 个基因组组装的 Contig N50 长度在 1.85 - 29.01 Mb 之间,最长 contig 为 2.02 - 171.62 Mb,这表明组装结果具备足够的连续性,能够用于分析大的结构变异。不过,LNCaP 细胞系由于基因组不稳定,其 Contig N50 长度较短 。
  3. 读深度与染色体畸变分析:以 CHM13 基因组为参考,分析 HiFi 原始读数深度,发现多个细胞系的 Y 染色体(ChrY)存在丢失现象,许多着丝粒和端粒区域也出现丢失或重复。通过基因组组装分析,鉴定出大量的易位和染色体重排位点,且前列腺癌细胞系的此类位点比肾肿瘤细胞系更多 。
  4. 基于图的泛基因组分析:利用 Minigraph - Cactus 泛基因组管道对 12 个肿瘤基因组组装中的遗传变异进行分析,同时结合其他工具生成基于映射的变异调用集。每个细胞系检测到 3.9M - 6.6 M 个变异,其中大部分是单核苷酸多态性(SNPs)和结构变异(SVs) 。
  5. 5 - 甲基胞嘧啶位点分析:对肿瘤细胞系中的 5mC 位点进行注释,发现所有细胞系都有大约 3000 万个潜在的 5mC 位点,过滤后的 5mC 位点(90% 概率)在 1000 万到 1800 万之间,这些位点在 5' 非翻译区(5' UTRs)和启动子区域主要呈耗尽状态 。

研究结论与讨论部分指出,该研究提供的泌尿生殖系统肿瘤基因组资源,为理解癌症基因组不稳定性如何导致染色体规模的突变提供了新的视角。通过高保真长读测序和基因组组装,研究人员成功解析了肿瘤细胞系的基因组结构,鉴定出多种染色体畸变和遗传变异。然而,研究也存在一定的局限性,比如基因组组装未完全达到单倍型水平,且由于缺乏匹配的正常细胞系,难以区分肿瘤特异性和非肿瘤特异性变异 。但总体而言,这项研究为后续深入研究泌尿生殖系统肿瘤的发病机制、精准诊断和个性化治疗奠定了坚实的基础,开启了从基因组层面深入理解肿瘤发生发展的新征程。

婵炴垶鎸搁鍫澝归崶鈹惧亾閻熼偊妲圭€规挸瀛╃€靛ジ鏁傞悙顒佹瘎闁诲孩绋掗崝鎺楀礉閻旂厧违濠电姴娲犻崑鎾愁潩瀹曞洨鐣虹紓鍌欑濡粓宕曢鍛浄闁挎繂鐗撳Ο瀣煙濞茶骞橀柕鍥ㄥ哺瀵剟骞嶉鐣屾殸闂佽偐鐡旈崹铏櫠閸ф顥堥柛鎾茬娴狀垶鏌曢崱妤婂剱閻㈩垱澹嗗Σ鎰板閻欌偓濞层倕霉閿濆棙绀嬮柍褜鍓氭穱铏规崲閸愨晝顩烽柨婵嗙墦濡鏌涢幒鎴烆棡闁诲氦濮ょ粚閬嶅礃椤撶姷顔掗梺璇″枔閸斿骸鈻撻幋锔藉殥妞ゆ牗绮岄埛鏍煕濞嗘劕鐏╂鐐叉喘閹秹寮崒妤佹櫃

10x Genomics闂佸搫鍊瑰姗€骞栭—娓媠ium HD 閻庢鍠掗崑鎾绘煕濮樼厧鐏犵€规洜鍠撶槐鎺楀幢濮橆剙濮冮梺鍛婂笒濡粍銇旈幖浣瑰仢闁搞儮鏅滈悾閬嶆煕韫囧濮€婵炴潙妫滈妵鎰板即閻樼數鐓佺紓浣告湰濡炶棄螞閸ф绀嗛柛鈩冡缚閳ь兛绮欓弫宥夋晸閿燂拷

濠电偛妫庨崹鑲╂崲鐎n偆鈻旈悗锝庡幗缁佺櫉wist闂侀潧妫楅敃锝囩箔婢舵劕妫樻い鎾跺仜缂嶄線鏌涢弽銊у⒈婵炲牊鍘ISPR缂備焦绋掗惄顖炲焵椤掆偓椤︿即鎮ч崫銉ゆ勃闁逞屽墴婵″鈧綆鍓氶弳鈺呮倵濞戞瑥濮冮柛鏃撴嫹

闂佸憡顨嗗ú婊呭垝韫囨稒鍤勯柣鎰嚟閵堟挳骞栭弶鎴犵闁告瑥妫濆濠氬Ω閵夛絼娴烽柣鐘辩劍瑜板啴鎮ラ敓锟� - 濠电儑绲藉畷顒勫矗閸℃ḿ顩查柛鈩冾嚧閹烘挾顩烽幖杈剧秵閸庢垵鈽夐幘顖氫壕婵炴垶鎼╂禍婊冪暦閻旇櫣纾奸柛鈩冭壘閸旀帡鎮楅崷顓炰槐闁绘稒鐟ч幏瀣箲閹伴潧鎮侀梺鍛婂笧婢ф寮抽悢鐓庣妞ゆ柨鐏濈粣娑㈡煙鐠ㄥ鍊婚悷銏ゆ煕濞嗘ê鐏ユい顐㈩儔瀹曠娀寮介顐e浮瀵悂鏁撻敓锟�

婵炴垶鎸搁鍫澝归崶顒€违濠电姴瀚惌搴ㄦ煠瀹曞洤浠滈柛鐐存尦閹藉倻鈧綆鍓氶銈夋偣閹扳晛濡虹紒銊у閹峰懎饪伴崘銊р偓濠氭煛鐎n偄濮堥柡宀€鍠庨埢鏃堝即閻樿櫕姣勯柣搴㈢⊕閸旀帡宕濋悢鐓幬ラ柨鐕傛嫹

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号