系统揭示长外显子的意义:基于代表性真核生物基因组的深度洞察

《BMC Genomics》:Systematic revelation and meditation on the significance of long exons using representative eukaryotic genomes

【字体: 时间:2025年03月25日 来源:BMC Genomics 3.5

编辑推荐:

  为探究长外显子和内含子分布不均的生物学意义,研究人员分析 7 种参考基因组,发现 3’UTR 避免剪接事件、最后外显子 GC 含量低等,为基因调控研究提供新视角。

  在生命科学的神秘领域中,基因组宛如一座蕴藏无数珍宝的 “矿山”,吸引着科研人员不断探索。随着组学时代的到来,海量的基因组数据为研究提供了丰富资源,但我们对基因组的认知仍犹如冰山一角。就拿长外显子和内含子来说,它们在基因组中的分布并不均匀,这一现象背后隐藏的生物学意义却一直模糊不清。此前,多数关于长外显子和内含子的研究仅聚焦于单一谱系,如哺乳动物或植物,缺乏广泛的普遍性探讨。因此,为了更全面地理解这一现象,挖掘其背后深层次的生物学意义和进化驱动力,中国农业大学和北京大学的研究人员展开了深入研究。相关成果发表在《BMC Genomics》杂志上,为该领域的研究开辟了新的方向。
研究人员采用了多种关键技术方法。首先,从多个数据库下载了 7 种具有代表性的真核生物参考基因组(包括人类、小鼠、果蝇、线虫、拟南芥、玉米和水稻)及其注释文件。接着,通过对注释文件的格式转换和处理,精确计算出不同外显子和内含子的长度。利用特定工具和编程语言,统计每个基因的转录本数量、每个转录本的外显子数量,并计算基因组区域的 GC 含量,同时搜索规范剪接基序。最后,运用 R 语言进行统计分析和绘图,以揭示数据背后的规律。

研究结果如下:

  1. 参考基因组的基本统计:不同物种的基因、转录本和外显子数量差异显著。哺乳动物基因数量较多,且每个基因的转录本数量也较多。同时发现,平均转录本和外显子数量受少数极端值影响,多数基因只有一个转录本,多数转录本只有一两个外显子。在比较外显子和内含子总长度时,发现 “内含子比外显子长得多” 的观点仅适用于人类和小鼠,果蝇中存在少数超长内含子拉高了平均长度,而多数内含子比外显子短,三种植物的外显子中位数长度高于内含子。
  2. 外显子长度与基因外显子数量的关系:研究发现,在所有 7 个物种中,单个外显子的长度随基因中外显子数量的增加而减小,这一现象符合内含子晚期假说,即内含子在进化过程中插入基因,使原始外显子分裂成多个新外显子,导致外显子数量增加的同时单个外显子长度缩短。唯一的例外是线虫,其单外显子基因(大多为非编码 RNA)往往比其他基因短。
  3. 内含子和外显子长度与位置的关系:对多外显子和多内含子基因的研究表明,除线虫外,内含子长度从 5’到 3’逐渐减小,证实了 “第一内含子较长” 的现象。而所有物种的最后外显子总是比其他外显子长,且这种长度差异随基因中外显子数量的增加而增大,暗示可能存在自然选择作用,使最后外显子倾向于更长的长度。
  4. 3’UTR 与剪接的关系:研究人员推测最后外显子较长的特性与 3’UTR 的性质有关。通过分析发现,3’UTR 的长度显著长于 5’UTR,且 3’UTR 中多外显子的比例远低于 5’UTR,规范剪接基序的密度也低于 5’UTR,这表明 3’UTR 显著避免剪接事件。这可能是因为 3’UTR 需要进行- 甲基腺苷()修饰和被微小 RNA(miRNA)靶向,剪接事件可能会干扰这些过程。
  5. 外显子的 GC 含量:GC 含量与多种生物学过程相关。研究发现,不同物种外显子和内含子的 GC 含量存在差异,果蝇、线虫和植物的外显子 GC 含量显著高于内含子,而人类和小鼠的外显子与内含子 GC 含量相当。进一步分析发现,所有物种的最后外显子 GC 含量低于内部外显子,部分物种的第一外显子 GC 含量具有特异性,如果蝇的第一外显子 GC 含量低于内部外显子,而哺乳动物、玉米和水稻的第一外显子 GC 含量高于内部外显子。

综合研究结果和讨论,该研究通过对 7 种代表性真核生物参考基因组的分析,揭示了长外显子的一些重要特征和规律。规范剪接事件和基序在 3’UTR 中显著减少,最后外显子具有较低的 GC 含量,果蝇基因的第一外显子 GC 含量低于内部外显子。这些发现不仅加深了我们对基因结构和调控的理解,为后续研究基因表达调控、进化生物学等领域提供了重要的理论基础,还为相关疾病的研究提供了新的思路。尽管目前仍有许多未知等待探索,但这项研究无疑为生命科学领域的发展迈出了坚实的一步,激励着科研人员继续深入挖掘基因组的奥秘。

濞戞挸顑堝ù鍥┾偓鐟邦槹瀹撳孩瀵奸敂鐐毄閻庢稒鍔掗崝鐔煎Υ婵犲洠鍋撳宕囩畺缂備礁妫滈崕顏呯閿濆牓妯嬮柟娲诲幘閵囨岸寮幍顔界暠闁肩瓔鍨虫晶鍧楁閸撲礁浠柕鍡楊儐鐢壆妲愰姀鐙€娲ゅù锝嗘礋閳ь剚淇虹换鍐╃閿濆牓妯嬮柛鎺戞閻庤姤绌遍崘顓犵闁诡喓鍔庡▓鎴︽嚒椤栨粌鈷栭柛娆愬灩楠炲洭鎯嶉弮鍌楁晙

10x Genomics闁哄倹婢橀幖顪渋sium HD 鐎殿喒鍋撻柛姘煎灠瀹曠喓绱掗崱姘姃闁告帒妫滄ご鎼佹偝閸モ晜鐣遍柛蹇嬪姀濞村棜銇愰弴鐘电煁缂佸本妞藉Λ鍧楀礆閸℃ḿ鈧粙鏁嶉敓锟�

婵炲棎鍨肩换瀣▔鐎n厽绁癟wist闁靛棗锕g粭澶愬棘椤撶偛缍侀柛鏍ㄧ墱濞堟厤RISPR缂佹稒鐩埀顒€顦伴悧鍝ヤ沪閳ь剟濡寸€n剚鏆╅悗娑欏姃閸旓拷

闁告娲滅划蹇涙嚄閻愬銈撮幖鏉戠箰閸欏棝姊婚妸銉d海閻犱焦褰冮悥锟� - 婵烇絽宕崣鍡樼閸℃鎺撶鎼达綆鍎戝☉鎾亾濞戞搩浜滃畷鐔虹磼閸℃艾鍔掗悗鍦仱閻涙瑧鎷嬮幑鎰靛悁闁告帞澧楅弳鐔煎箲椤斿灝绐涢柟璨夊倻鐟㈤柛娆樺灥椤宕犻弽顑帡寮搁敓锟�

濞戞挸顑堝ù鍥Υ婵犲嫮鐭庨柤宕囧仜閸炴挳鎽傜€n剚顏ら悹鎰╁妺缁ㄧ増鎷呭⿰鍐ㄧ€婚柡瀣姈閺岀喎鈻旈弴鐘虫毄閻庢稒鍔掗崝鐔煎Υ閿燂拷

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号