《Nature Genetics》破译人类基因调控“语法”:基因表达的关键原子单位

【字体: 时间:2022年02月24日 来源:Nature Genetics

编辑推荐:

  一个研究小组发现了控制人类细胞基因调控的逻辑。在未来,这一新知识可以应用于研究癌症和其他遗传疾病。

  

人类基因组的DNA包含编码蛋白质的基因,这些蛋白质反过来赋予肌肉细胞力量,赋予脑细胞处理信息的能力。DNA还包含基因调节元件,决定基因在何时何地表达——因此肌肉基因在肌肉中表达,大脑基因在大脑中表达。

然而,决定基因活动的调控代码仍然知之甚少。尽管人类基因组包含了近30亿个碱基对,但仅从基因组序列中学习基因调控代码还是太短了。这个问题类似于语言学家试图通过几篇短文来理解一种被遗忘的语言所面临的问题。

芬兰科学院肿瘤遗传学研究卓越中心的Jussi Taipale教授的一个研究小组,现在已经找到了解决这一问题的方法。

这项新研究最近发表在《Nature Genetics》杂志上。

该研究的第一作者、芬兰科学院研究员Biswajyoti Sahu说:“我们从一组DNA序列中测量了基因调控活动,这些DNA序列加起来比整个人类基因组大100倍。”

“我们没有使用自然的基因组序列,而是将随机合成的DNA序列引入人类细胞。然后,细胞本身被允许阅读新的DNA,并为我们突出作为活性调节元件的序列,”Sahu补充道,描述了这种创新的方法。

研究人员确定了基因表达的关键原子单位

研究人员使用一种被称为大规模并行报告基因分析(massively parallel reporter assay)的技术制作了他们的大规模数据集,在这种技术中,数百万个DNA序列的调节活动可以在一次大规模试验中同时研究。这些数据是用人工智能工具分析的。

基因表达是由结合DNA的蛋白质调控的,被称为转录因子。研究人员发现,这些因子结合的非常短的DNA序列构成了基因表达的关键原子单位。单个转录因子以加性的方式参与基因调控。换句话说,每个因素都独立地增加调节活动,而不与其他因素有特定的相互作用。此外,转录因子在基因调控过程中可能具有多种平行功能,如提高基因表达速率或确定转录开始的基因组位置。

“转录因子的结合基序可以被认为是共同定义细胞基因调控代码的单词,”Jussi Taipale教授解释说。

研究人员发现,密码的语法相对较弱,大多数单词几乎可以按照任何顺序排列,而不会改变它们的意思。

“然而,在某些情况下,类似于复合词,语法是强的,特定的因素组合需要以一定的顺序绑定,以激活基因表达,”Taipale继续说。

细胞中只有少数高度活跃的转录因子

研究人员比较了三种不同的人类细胞类型:结肠癌和肝癌细胞以及来自视网膜的正常细胞。他们发现只有少数转录因子在细胞中高度活跃。此外,无论细胞类型如何,大多数转录因子的活性都是相似的。

结果显示,基因调控人类细胞中的元素可以分为不同类型根据染色质上下文他们位于——无论是在封闭的染色质DNA密集的地区,或在一个更开放的染色质环境中,周围的DNA没有紧密组蛋白蛋白质。

传统上,活性调控元件被认为位于开放染色质区域内,DNA很容易接近转录因子。因此,发现在染色质封闭区域内发挥作用的活性调节元件是这项研究的中心新观察之一。此外,研究人员还发现了依赖于染色质的调控元件。这些元素在基因组中正常的位置是活跃的,但如果它们从原来的位置移走并转移到靠近另一个基因的位置,它们的活性就会大幅下降。

Biswajyoti Sahu, Tuomo Hartonen, Päivi Pihlajamaa, Bei Wei, Kashyap Dave, Fangjie Zhu, Eevi Kaasinen, Katja Lidschreiber, Michael Lidschreiber, Carsten O. Daub, Patrick Cramer, Teemu Kivioja, Jussi Taipale. Sequence determinants of human gene regulatory elements. Nature Genetics, 2022

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号