编辑推荐:
为探究转座子(TEs)在家畜中的功能,研究人员对猪、牛、鸡进行多组学分析,揭示其重要调控作用。
在生命科学的奇妙世界里,基因如同精密的代码,掌控着生物的各种奥秘。转座子(Transposable elements,TEs)作为基因大家庭中的特殊成员,一直以来备受关注。它是一种重复性 DNA 序列,在脊椎动物基因组中占比 4% - 60% 不等,就像基因组里的 “活跃分子”,能通过转座在基因组内复制和改变位置。起初,人们以为它是 “垃圾 DNA”,但后来发现,它其实是遗传和调控变异的重要来源,对基因组进化和基因调控有着关键作用,比如能影响基因编码序列、为非编码 RNA 的产生提供原材料,还能作为顺式调控元件(cis-regulatory elements,CREs)的基础元件 。
不过,相比人类和模式生物,家畜中 TEs 的研究却远远落后。虽然家畜功能基因组学研究已产生多种家畜的多组织 CREs 图谱,但 TEs 在这些 CREs 形成中的作用,以及对不同组织基因调控网络(Gene regulatory networks,GRNs)的影响,依旧迷雾重重。为了揭开这些谜团,中国农业科学院深圳农业基因组研究所等单位的研究人员展开了深入研究,相关成果发表在《iScience》杂志上。
研究人员为了全面解析 TEs 在家畜基因组中的作用,运用了多种关键技术方法。他们整合了染色质免疫沉淀测序(ChIP-seq)、转座酶可及染色质测序(ATAC-seq)和 RNA 测序(RNA-seq)等多组学数据 ,对 TEs 进行全面分析。同时,使用 RepeatMasker 软件注释 TEs,构建了基于组织特异性 TEs 的基因调控网络(TE-GRNs)。此外,研究中的样本来源于公开数据库,涉及猪、牛、鸡的多个组织,为研究提供了丰富的数据基础。
研究人员取得了一系列重要成果:
- TEs 的基因组景观:研究人员利用 RepeatMasker 软件对猪、牛、鸡的基因组进行注释,发现 TEs 在猪和牛基因组中占比较高,分别为 43.4% 和 47.5%,在鸡基因组中占 9.6%。LINE 类在三个物种基因组中占比最高,且不同物种有特异性的 TE 家族,如鸡的 LINE/CR1 家族、猪的 SINE/tRNA 家族、牛的 SINE/Core-RTE 等家族占比较高。此外,TEs 倾向于插入远端基因间和内含子区域,LTR 反转录转座子在非编码区偏好性更高12。
- TEs 的扩增模式:研究发现不同家畜物种的 TEs 扩增模式存在差异。猪和牛的 LINEs 和 SINEs 扩增模式不同,猪有两次扩增爆发,牛有三次;鸡的 SINEs 和 LINEs 只有一次扩增爆发,且 LINEs 在现代鸡基因组中仍保持高扩增水平,SINEs 则失去扩增能力。此外,研究还揭示了不同 TE 类别的基因组分布相关性,如 LTR 和 LINE 密度在三个物种中均呈正相关34。
- TEs 对组织特异性染色质可及性的调控:通过 ATAC-seq 数据,研究人员发现 SINE 类在三个物种的所有组织中均富集开放染色质信号,LINE 和 DNA 类则表现为缺失。在猪和牛中,LTR 类在组织中表现出较高的染色质可及性信号富集,而鸡中则为缺失。研究还发现,TEs 对 CREs 的贡献在不同物种间存在差异,且老的 TEs 在形成 CREs 时具有跨物种的偏好性。此外,组织特异性 TEs 显著富集与组织发育相关的转录因子(TF)结合基序,表明其在调节组织相关生物学过程中发挥重要作用56。
- TEs 对 CREs 表观遗传状态的影响:研究人员将 CREs 分为启动子、增强子和候选沉默子元件(CSEs),构建了三个物种五个组织的 CREs 图谱。分析发现,TEs 在 CREs 中的比例在不同物种和 CREs 类型间存在差异。在猪和牛中,LINEs 在 CREs 中表现为缺失,SINEs 则富集;在鸡中,DNA 元件在 CSEs 中富集,LINEs 在增强子和启动子中富集 。此外,LTR 家族在猪和牛的 CSEs 中富集,可能通过招募抑制性 TF 影响 CSEs 活性78。
- TEs 的组织特异性表达与生物学过程:研究人员构建了猪、牛、鸡五个组织的 TE 表达图谱,发现 TE 表达具有组织特异性。在猪和牛中,组织特异性 TEs 在非编码区显著富集,且其邻近基因在组织相关生物学过程中显著富集;在鸡中,这种富集模式仅在肝脏和脾脏中观察到 。
- 利用组织特异性 TEs 剖析 GRNs:研究人员开发了一种计算框架来构建 TE-GRNs,并以肝脏为例进行验证。分析发现,不同物种肝脏的 TE-GRNs 中存在共享和物种特异性的 TFs,且这些 GRNs 中的基因在代谢等生物学过程中显著富集,为理解肝脏相关经济性状的遗传基础提供了重要线索910。
在这项研究中,研究人员全面解析了猪、牛、鸡基因组中 TEs 的特征、功能及其对基因调控网络的影响。通过构建 TE-GRNs,为深入理解家畜复杂性状的遗传基础提供了新视角,也为后续研究 TEs 在其他生物学过程中的作用奠定了基础。不过,研究也存在一定局限性,如仅使用五个组织的数据可能导致组织特异性识别偏差,依赖组蛋白标记鉴定调控元件可能出现假阳性等。但随着家畜多组学数据的不断积累,研究方法和技术的不断改进,这一领域的研究有望取得更多突破,为家畜遗传育种和健康管理提供更有力的支持。