编辑推荐:
研究人员为精准调控基因表达及改良作物性状,开展 CRE 相关研究,构建计算框架助力基因编辑。
基因表达调控在生物的生长发育和性状表现中起着关键作用,就像一本精细的操作指南,决定了细胞的功能和生物体的特征。而在这个指南中,
顺式调控元件(CRE) 是极为重要的 “密码”。它与反式作用因子共同决定基因表达,在植物中,大量的性状变异都与功能性调控变异相关,这意味着对 CRE 进行遗传工程操作,有望深入理解调控变异如何影响表型变异,进而实现作物的改良,为农业生产带来新的突破。
然而,目前实现精准的基因调控困难重重。一方面,虽然可以利用一些表观基因组信号间接推断 CRE,但这些方法只能确定宽泛的基因组区域,无法实现高分辨率的识别和精准编辑。另一方面,通过穷举搜索或随机编辑来寻找 CRE,成本高昂且不可行,尤其是对于基因组庞大的作物,如玉米和番茄。在这样的背景下,华中农业大学等机构的研究人员开展了一项重要研究,旨在找到一种新的方法来准确识别 CRE,并实现对基因表达的精准调控。该研究成果发表在《Genome Biology》上,为基因编辑和作物改良领域带来了新的曙光。
研究人员采用了多种关键技术方法。首先,构建了两个序列到表达的深度学习模型 Basenji2-long 和 Basenji2-3K,利用不同长度的基因组序列作为输入,结合可解释性方法,在多个植物物种中进行分析。同时,运用 UMI-STARR-seq 技术,对候选的 CRE 进行实验验证,以确定其增强子活性。此外,通过 CRISPR-Cas9 技术对目标基因进行编辑,验证模型预测的效果。
在研究结果方面,主要有以下几个重要发现:
准确预测基因表达 :通过深度学习模型,研究人员成功在多个植物物种中准确建立了 DNA 序列与基因表达之间的关系。以玉米为例,优化后的 Basenji2-long 模型在输入 120K-bp 序列时,预测性能达到最佳,皮尔逊相关系数(PCC)为 0.733。其他植物物种如水稻、番茄和拟南芥,也在各自的最佳输入长度下取得了良好的预测准确性,这表明模型能够有效捕捉复杂的调控信息。
构建全基因组调控图谱 :借助模型的可解释性方法,研究人员在全基因组范围内识别出大量候选 CRE。在玉米中,共鉴定出 745,684 个候选 CRE,这些 CRE 在基因组中的分布有一定特点,大部分位于转录起始位点(TSS)近端区域,但远端区域也存在不少候选 CRE,且与已知的远端增强子位置相符。通过与已有研究和实验数据的对比,验证了模型识别远端 CRE 的有效性。此外,研究还发现候选 CRE 与定量性状位点(QTL)存在大量重叠,暗示其在调控农艺性状和基因表达方面的重要作用。
验证候选 CREs :利用 UMI-STARR-seq 技术,研究人员对 12,000 个候选 CRE 进行了实验验证。结果显示,约 40.9% 的序列表现出增强子活性。不同组别的候选 CRE 增强子比例有所差异,其中与先前研究中增强子重叠的组(Group 1)比例最高,新鉴定的组(Group 3)也有较高比例的增强子,这表明新鉴定的 CRE 具有重要的调控功能。研究人员还通过具体实例,如针对 Zm00001d005208 基因的候选增强子,展示了这些 CRE 在调控基因表达方面的潜力。
高分辨率绘制 TSS 近端 CREs 图谱 :为了更精确地调控基因表达,研究人员聚焦于 TSS 近端区域,构建了 Basenji2-3K 模型。通过该模型和另一种可解释性方法 “Occlusion”,对 TSS 近端 CREs 进行了高分辨率的识别和分析。结果表明,启动子和 5’UTR 在调控基因表达中起关键作用,不同基因根据其贡献分数被分为不同的簇,展现出不同的表达模式和组织特异性。
评估编辑效果 :研究人员提出 “编辑可塑性(EP)” 的概念,用于评估启动子编辑对基因表达变化的潜力。通过对 ZmFCP1 基因的研究发现,单个峰值的删除对基因表达影响较小,而多个峰值的组合删除则能引起显著的表达变化。研究还发现 EP 与基因的可进化性相关,具有较高 EP 的基因往往具有更高的组织特异性和表达变异性。
AI 引导的基因编辑实验 :以 ZmVTE4 基因(对 α - 生育酚含量至关重要)为例,研究人员在计算机模拟中利用 EP 预测启动子编辑的结果,确定了关键的编辑位点。通过 CRISPR-Cas9 技术进行基因编辑实验,成功获得了编辑后的等位基因,其中 vte4-cr4 等位基因显著增加了 ZmVTE4 基因的表达和 α - 生育酚含量,验证了 AI 引导编辑策略的有效性。
研究结论和讨论部分指出,该研究构建了一个强大的计算框架,通过可靠地预测和验证 CRE,为精准调控基因表达和作物改良提供了有力的工具。“编辑可塑性” 概念的提出,以及与可进化性空间的结合,为基因编辑实验提供了清晰的指导。然而,目前的研究也存在一些局限性,如模型未考虑环境因素的影响,在预测一些复杂的顺式调控相互作用时准确性有限。未来,研究人员计划通过整合环境数据和多组织特异性数据,进一步优化模型,提高其准确性和适用性,为作物改良和精准育种提供更强大的支持。这项研究为基因编辑和作物改良领域奠定了坚实的基础,有望推动农业生物技术的进一步发展,实现更高效、可持续的农业生产。
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》