-
生物通官微
陪你抓住生命科技
跳动的脉搏
《Cell Genomics》转录因子剂量定量反应的序列决定因素:迁移学习带来的新发现
【字体: 大 中 小 】 时间:2025年02月28日 来源:Cell Genomics 11.1
编辑推荐:
为探究顺式调控密码,研究人员运用迁移学习研究 TF 剂量变化对染色质可及性的影响,揭示关键序列特征。这一研究成果意义非凡,它为揭示顺式调控密码的更多层面提供了全新的方法,也为理解剂量敏感性疾病的发病机制带来了新的希望。该研究发表于《Cell Genomics》期刊
在生命的微观世界里,基因表达的调控就像一场精密的交响乐演奏,每个音符都恰到好处,才能奏响生命的和谐乐章。其中,转录因子(TF)与 DNA 序列的相互作用是这场演奏的关键环节,它们掌控着基因表达的节奏和旋律。然而,长期以来,科学家们一直试图解开一个谜团:DNA 序列究竟是如何编码精确、及时且具有环境特异性的基因表达的?这就是神秘的顺式调控密码(cis - regulatory code)。
随着研究的深入,深度学习模型为预测染色质状态带来了新的曙光。它能从 DNA 序列中预测调控元件(RE)的染色质状态,但大多局限于未受扰动的细胞。在现实中,TF 在人类变异和疾病中表现出高度的剂量敏感性,理解染色质状态如何响应 TF 水平的定量变化,对于深入了解转录调控机制以及解释 TF 水平变异如何导致正常和疾病相关的表型多样性至关重要。然而,预测染色质对 TF 剂量的反应面临两大挑战:一是难以获得内源性 TF 水平反应的精确实验测量;二是深度学习模型需要大量训练示例,而实际能用于单一 TF 扰动研究的 REs 数量有限。
为了攻克这些难题,来自斯坦福大学医学院等机构的研究人员展开了深入研究。他们巧妙地将染色质可及性模型的迁移学习(transfer learning)与通过 dTAG 系统进行的 TF 剂量滴定相结合,聚焦于研究剂量敏感的 TF——TWIST1 和 SOX9,探究它们在面部祖细胞(cranial neural crest cells,CNCCs)中对 RE 染色质可及性的影响。这一研究成果意义非凡,它为揭示顺式调控密码的更多层面提供了全新的方法,也为理解剂量敏感性疾病的发病机制带来了新的希望。该研究发表于《Cell Genomics》期刊。
在研究过程中,研究人员运用了多种关键技术方法。首先,利用 dTAG 系统精确调节 TWIST1 和 SOX9 的剂量,通过该系统中 FKBP12 - F36V 标签介导的靶蛋白降解机制,在添加 dTAGV - 1 小分子后,实现对目标 TF 剂量的精准调控。其次,采用转座酶可及染色质测序(assay for transposase - accessible chromatin with sequencing,ATAC - seq)技术,检测不同 TF 剂量下 CNCCs 的染色质可及性变化,获取染色质状态的关键信息。再者,借助迁移学习,先在大量相关示例上对深度学习模型进行预训练,再针对预测 TF 剂量反应的任务进行微调,从而提高模型预测的准确性。
研究结果如下:
精确调节 TWIST1 剂量:研究人员成功运用 dTAG 系统在人类胚胎干细胞(hESC)来源的 CNCCs 中精确调节 TWIST1 剂量。通过对 TWIST1 - tagged hESCs 进行分化,并添加不同浓度的 dTAGV - 1,实现了五个不同的 TWIST1 剂量水平。ATAC - seq 分析显示,TWIST1 剂量对染色质可及性有非线性、单调的影响,不同 REs 对 TWIST1 剂量的反应从缓冲(buffered,即 TWIST1 剂量大幅降低时染色质可及性才有微小变化)到敏感(sensitive,即 TWIST1 剂量稍有降低,染色质可及性就有相应变化)不等。
准确预测 RE 对 TF 剂量的反应:运用迁移学习,研究人员能够准确预测 RE 对 TWIST1 和 SOX9 剂量的反应。通过计算 log2 倍变化和中位有效剂量(ED50)等指标量化 RE 反应,并使用微调的 ChromBPNet 模型进行预测。结果表明,该模型在预测 TF 完全耗尽的效应和 ED50方面,显著优于基线方法,预测准确性与实验可重复性大致相当。
确定预测 RE 对 TF 剂量反应的序列特征:对微调后的深度学习模型进行解读,发现了预测 RE 对 TF 剂量反应的序列特征。对于 SOX9 和 TWIST1,与其他 TF 的异型共结合基序(heterotypic co - binding motifs)预测缓冲反应,而低亲和力结合位点或同型结合基序(homotypic binding motifs)则预测敏感反应。例如,TWIST1 的低亲和力结合位点,如退化的 Coordinator 基序,虽然与规范的 Coordinator 基序相比亲和力较低,但对 TWIST1 的反应性有重要贡献,能使染色质对 TF 剂量变化更敏感。
验证模型预测:研究人员通过增强子报告基因检测(enhancer reporter assays)对模型预测进行实验验证。选择 19 个强 TF 依赖的 REs 进行检测,发现内源性 RE 可及性与报告基因活性在 100% TF 剂量时呈正相关。对 7 个野生型增强子设计突变序列并检测,结果显示预测的 ΔED50值与观察值之间存在强正相关,证实了模型揭示的预测序列特征的准确性。
解释低亲和力位点的敏化效应:利用先前开发的 TF - 核小体竞争模型,研究人员发现 TF - 核小体竞争(TF - nucleosome competition)可以解释低亲和力位点的敏化效应。在强 TF - 核小体竞争条件下,低亲和力位点的添加会增加 ED50,使染色质对 TF 剂量变化更敏感。通过对模型的拟合分析,得到的参数支持了强 TF - 核小体竞争的理论情景。
研究结论和讨论部分指出,该研究揭示了 RE 对 SOX9 或 TWIST1 剂量反应的序列特征,表明低亲和力 TF 结合位点在调控 RE 活性和基因表达中具有重要作用。虽然未发现低亲和力的 SOX9 位点对 SOX9 剂量敏感性有重要影响,但 AP - 1 位点可能作为低亲和力 SOX9 位点间接招募 SOX9,不过这还需要进一步实验验证。此外,TF - 核小体竞争模型虽能解释低亲和力位点的敏化效应,但模型中低 - 高亲和力结合位点距离的假设还可通过核小体间相互作用或 TF 介导的染色质修饰招募等机制进行扩展。该研究还为解释 TF 剂量扰动与人类性状和疾病中表型特异性的关联提供了潜在依据,同时凸显了对扰动状态下的表观基因组数据应用深度学习的重要性,有助于解读和精细定位全基因组关联研究(GWASs)中的变异。然而,研究也存在一定局限性,如未明确建模其他调控因素,实验验证使用的增强子报告基因检测可能无法完全反映内源性环境的影响,研究对象仅为两种 TF 和一种细胞类型,其结果的普适性有待进一步研究。但总体而言,这项研究为深入理解顺式调控密码和剂量敏感性疾病的机制奠定了重要基础,为后续研究开辟了新的方向。
知名企业招聘
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号