编辑推荐:
本文聚焦于植物基因组编辑技术,详细介绍了寡核苷酸定向诱变(ODM)、位点特异性核酸酶(如 MegNs、ZFNs、TALENs、CRISPR/Cas)等技术,探讨其在小麦育种中的应用。同时,分析了不同国家和地区对基因编辑作物的监管情况,展现该技术发展现状与挑战。
引言
自 10,000 年前人类在新月沃土开始农耕,作物改良便至关重要。早期育种方法简单,直到孟德尔的研究成果被重新发现,植物育种才走上科学道路。20 世纪 60 年代起,高产品种的采用、农业机械化以及化肥、农药的发展,推动了作物产量大幅提升,如小麦、玉米和水稻产量显著增加,这一时期被称为 “绿色革命”。
全球人口持续增长,对粮食的需求不断增加。然而,农业面临着诸多挑战,如气候变化导致极端天气频发,影响作物产量和价格;土地资源竞争加剧、淡水供应不足、劳动力短缺和成本上升、土壤退化等问题也制约着农业发展。同时,人们对食品安全、营养和品质的要求越来越高,对非食品用途的农产品需求也在增加。因此,作物改良的需求依旧迫切。
转基因(GM)技术曾是作物改良的重要手段,但在一些地区面临严格监管,发展受限。而基因组编辑技术作为新兴技术,有望为作物改良带来新的突破,本文将重点探讨其在小麦育种中的应用以及在复杂监管环境下的发展情况。
基因组编辑:生物技术作物改良的第二次革命
如果说转基因技术是作物改良的第一次生物技术革命,那么基因组编辑可被视为第二次革命。基因组编辑是一系列能够对目标基因进行特定改变的技术,即靶向诱变。部分技术涉及基因修饰步骤,但编辑完成后,转基因可被分离去除,最终得到无转基因、仅原生基因被 “编辑” 的植物。这些技术主要分为寡核苷酸定向诱变(ODM)和使用位点特异性核酸酶(如归巢核酸内切酶(MegNs)、锌指核酸酶(ZFNs)、转录激活样效应物核酸酶(TALENs)、成簇规律间隔短回文重复序列(CRISPR)相关(Cas)核酸酶)的技术。
寡核苷酸定向诱变(ODM)
ODM 中使用的寡核苷酸通常是长度在 20 - 100 个核苷酸的单链 DNA 分子,也有变体,如双链 RNA - DNA 寡核苷酸(RDOs)和小片段同源替换(SFHR),后者使用长度大于 200 个核苷酸的单链或双链 DNA 分子。寡核苷酸的设计与植物目标基因的核苷酸序列基本相同,仅存在少数(通常 1 - 5 个)“错配” 核苷酸,这些错配核苷酸就是要引入基因组的突变。
寡核苷酸可通过聚乙二醇处理或电穿孔导入原生质体,也可通过粒子轰击导入培养的植物细胞。导入后,它会与目标基因的互补核苷酸序列结合。植物自身的 DNA 修复机制会在错配处替换核苷酸,有时会倾向于引入寡核苷酸携带的突变,或者用寡核苷酸替换原生 DNA 片段。
美国农业部、加拿大卫生部等监管机构将 ODM 归类为诱变技术而非转基因技术。Cibus 公司利用 ODM 技术生产出耐除草剂的油菜品种,该品种与巴斯夫的 CLEARFIELD? 生产系统配合使用,通过在两个乙酰乳酸合酶(ALS)基因中引入单核苷酸突变,使编码的酶保持活性但不再与抑制性除草剂结合。2014 年,加拿大卫生部批准该油菜品种用于食品,为其商业化种植铺平了道路。
位点特异性核酸酶(归巢核酸内切酶、锌指核酸酶、TALENs 和 CRISPR/Cas9)
使用位点特异性核酸酶(SDNs,也称为序列特异性核酸酶)进行基因组编辑,同样利用了细胞自身的 DNA 修复机制。正常情况下,这些机制用于修复由电离辐射或化学诱变剂等引起的 DNA 双链断裂。细胞有多种修复 DNA 双链断裂的机制,部分机制容易出错,基因组编辑正是利用了细胞 DNA 修复机制在 DNA 序列中引入突变的特性。
目前有四类 SDNs 可用于基因组编辑。其中,MegNs、ZFNs 和 TALENs 通过蛋白质 - DNA 相互作用靶向正确序列,识别序列后,核酸酶结构域切割 DNA,随后由植物自身的 DNA 修复机制进行修复。
归巢核酸内切酶(MegNs)
MegNs 是源自微生物的天然限制性内切酶,其 DNA 识别序列通常为 12 - 40bp,可进行工程改造以识别不同的靶位点,从而靶向特定目标基因。然而,蛋白质的 DNA 识别结构域与核酸酶结构域重叠,改造靶位点特异性可能会影响酶切割 DNA 的能力。虽有研究人员通过复杂的蛋白质建模技术克服了这一问题,但 MegNs 的使用在很大程度上已被更简便的方法取代。MegNs 已成功用于编辑作物物种,但尚未有以此法培育的作物品种进入市场。
锌指核酸酶(ZFNs)
ZFNs 是人工构建的限制性内切酶,由锌指类转录因子的 DNA 结合结构域与 FokI 核酸酶的催化结构域融合而成。锌指结构域中的单个 “手指” 由围绕锌离子折叠的 30 个氨基酸组成,每个锌指结合一个特定的 3 碱基对靶位点,通过组合不同的锌指可设计出针对任意 DNA 序列的结合结构域。FokI 以二聚体形式发挥作用,因此需将两个 DNA 识别结构域分别与 FokI 核酸酶结构域融合,使其在靶位点结合。
ZFNs 比 MegNs 更容易设计,但脱靶效应更强,因为其特异性不仅取决于靶 DNA 序列本身,还与周围区域有关,可能导致 DNA 多处断裂,引发基因组片段化和不稳定。ZFNs 已用于编辑小麦的乙酰羟酸合酶(AHAS)基因,使其对除草剂咪唑乙烟酸产生抗性;在玉米中用于实现转基因的位点特异性整合,构建多基因堆栈;在烟草中编辑 GUS:NPTII 报告基因以产生染色体断裂;在水稻中编辑 OsQQR 基因,用于检测和识别特定染色体位置的基因整合位点,以实现除草剂耐受性。不过,目前尚未有使用 ZFNs 培育的商业作物品种。
转录激活样效应物核酸酶(TALENs)
与 MegNs 和 ZFNs 相比,TALENs 成本更低、效率更高、特异性更强,脱靶效应更少,毒性也更低。TALENs 是 DNA 结合结构域与 Fok1 核酸酶催化结构域的人工融合物,其 DNA 结合结构域来自转录激活样效应物(TALEs),TALEs 是由黄单胞菌属植物病原体产生的一类蛋白质,在感染过程中,TALEs 进入植物细胞并激活特定基因表达,使植物更易被病原体侵染。
TALEs 的 DNA 结合区域由约 30 个 33 - 35 个氨基酸的串联重复序列组成,序列特异性由两个可变氨基酸(重复可变双残基)赋予。通过组装具有适当重复可变双残基的重复序列阵列,可靶向任何基因。但 TALENs 是相对较大的蛋白质。
2013 年,TALENs 用于植物基因组编辑的技术得到验证。美国 Calyxst 公司利用 TALENs 生产出首个商业化的经 SDN 编辑的作物品种 Calyno,这是一种高油酸大豆,通过敲除参与油酸去饱和的 FAD2 - 1A、FAD2 - 1B 和 FAD3A 基因,阻止油酸(一种单不饱和脂肪酸)转化为多不饱和脂肪酸亚油酸和 α - 亚麻酸,使编辑后的大豆油中油酸含量达到约 80%。高油酸大豆油在储存过程中不易氧化,无需化学氢化,避免了反式脂肪酸的产生。
TALENs 还用于小麦,敲除 TaMLO 基因,使其获得抗白粉病能力;在土豆中编辑 ALS 基因和内源性组成型启动子,赋予除草剂耐受性,编辑液泡转化酶(vlnv)基因,降低还原糖含量,提高储存稳定性,减少油炸和烘焙过程中丙烯酰胺的形成;在甘蔗中靶向咖啡酸 O - 甲基转移酶,降低木质素含量,提高生物燃料产量;在水稻中编辑 OsBADH2 基因,培育出更香的水稻。不过,这些携带相关性状的品种尚未商业化。
成簇规律间隔短回文重复序列(CRISPR)/CRISPR 相关蛋白(Cas)(CRISPR/Cas)
CRISPR/Cas 核酸酶系统使基因组编辑技术备受关注。与 MegNs、ZFNs 和 TALENS 依赖蛋白质 - DNA 相互作用识别 DNA 靶位点不同,CRISPR/Cas 系统使用引导 RNA(gRNA)引导 Cas 核酸酶靶向。设计编码 gRNA 的基因比设计编码蛋白质靶向结构域的基因更容易,预测脱靶效应也更简单,且可通过在同一实验中使用多个 gRNA(多重编辑)同时引入多个编辑。
CRISPR/Cas 是一种细菌免疫系统,由加州大学伯克利分校的 Jennifer Doudna、瑞典于默奥大学的 Emmanuelle Charpentier 及其同事发现,二人因此获得 2020 年诺贝尔化学奖。该系统可抵抗外来遗传元件,如入侵噬菌体。它由 29 个核苷酸的重复 DNA 序列和 32 个核苷酸的可变间隔区组成,间隔区源自 “捕获” 的病毒 DNA 片段。当入侵病毒的 DNA 被 Cas 蛋白复合物识别时,会整合一个与病毒 DNA 对应的新重复 - 间隔单元,新的 CRISPR 重复 - 间隔阵列随后转录为前体 CRISPR RNA(pre - crRNA),加工成 CRISPR RNA(crRNA),引导核酸酶破坏入侵病毒的 DNA。
在植物基因组编辑中,最广泛使用的 Cas 核酸酶是来自酿脓链球菌的 Cas9。在天然系统中,Cas9 激活还需要反式激活 crRNA(tracrRNA),tracrRNA 与 pre - crRNA 互补形成 crRNA/tracrRNA 杂交体,引导 Cas9 核酸酶靶向。在基因组编辑应用中,tracrRNA 和 crRNA 可融合为单引导 RNA(sgRNA),即现在常用的 gRNA。gRNA 可设计靶向任何基因序列,但编辑需要靶位点附近存在原间隔相邻基序(PAM),其序列为 NGG(N 为任意碱基)。Cas9 核酸酶与 gRNA 结合后才会激活,结合 gRNA 后,它会锚定在相邻的 PAM 位点并切割 DNA,产生双链断裂。CRISPR/Cas9 比 MegNs、ZFNs 或 TALENs 更快、更特异性,适应性更强,广泛应用于医疗和作物改良等领域。
另一种在植物基因组编辑中逐渐受到关注的 Cas 核酸酶是 Cas12a(以前称为 Cpf1),源自酸胺球菌属。在天然系统中,Cas12a 仅需单个 RNA 分子即可发挥作用,切割后产生粘性末端,更适合需要在切割位点插入 DNA 的敲入应用。它的 PAM 位点与 Cas9 不同,为 YTN(Y 为嘧啶,即胸腺嘧啶或胞嘧啶,N 为任意碱基)。
2013 年,CRISPR/Cas9 在植物中的应用首次得到验证。抗病性是该技术最早靶向的性状之一,如编辑柑橘的 CsLOB1 基因,使其获得抗柑橘溃疡病能力;编辑黄瓜的 eIF4E 基因,赋予其广泛的病毒抗性;编辑烟草的相关基因,使其抵抗黄矮病毒;编辑番茄的基因,使其抵抗黄化曲叶病毒和白粉病。
气候适应性 / 非生物胁迫耐受性也是研究热点。编辑玉米的 ARGOS8 基因,使其具有耐旱性;敲除水稻中的 NAC 转录因子 OsNAC041,增加其对盐的敏感性,表明该基因参与盐胁迫响应;敲除番茄的促分裂原活化蛋白激酶基因 SlMAPK3,降低其耐旱性。
CRISPR/Cas9 还用于改善作物品质、提高营养含量和赋予健康益处。编辑番茄的 NOR 基因,可延缓果实成熟和软化;敲除多个基因,使番茄红素含量增加超过 5 倍。在水稻中编辑多个基因,提高产量,如编辑 DEP1 基因,影响稻穗大小;在大麦中敲除 SDP1 脂肪酶基因,使叶片和茎中积累储存油,提高饲料的代谢能含量;英国约翰英纳斯中心的研究人员敲除小麦的 VRT - A2 基因,增加麦粒大小。
在实验室中,研究人员使用 CRISPR/Cas9 敲除小麦的天冬酰胺合成酶 - 2(TaASN2)基因。小麦籽粒中积累高浓度的游离天冬酰胺,在高温烹饪和加工过程中会转化为有毒且可能致癌的丙烯酰胺。TaASN2 基因在麦粒中高度表达,且在植物其他部位不表达,是理想的编辑靶点。研究人员使用 4 个 gRNA 同时编辑,提高编辑成功率。编辑后的两个品系 Line 178(A 基因组 TaASN2 基因敲除)和 Line 23(总 TaASN2 基因敲除)于 2021 - 2022 年进行了田间试验(欧洲首次对基因编辑小麦进行的田间试验),Line 23 的麦粒中游离天冬酰胺浓度比对照显著降低约 50%,Line 178 降低了 14%。
目前,已有部分经 CRISPR/Cas9 编辑的小麦品系进行或正在进行田间试验,但只有一种具有广泛持久抗白粉病的小麦品种于 2024 年 5 月获得中国批准用于种植和消费。该品种敲除了所有三个基因组中的感病位点 O(MLO)基因,且 B 基因组中 MLO - B 基因上游 304kb 处有大片段缺失,导致相邻基因 TMT3 异位激活,TMT3 编码液泡单糖转运蛋白,负责将葡萄糖从细胞质转运到液泡,正常情况下仅在穗中表达,编辑后的缺失改变了基因周围的染色质景观,解除了表观遗传抑制,使 TMT3 异位表达,逆转了敲除 MLO 基因通常带来的产量损失。
简单敲除、同源定向修复和引导编辑
使用的所有 SDNs 通过在 DNA 中引入双链断裂,并依赖细胞自然的易错修复机制进行修复,从而引入突变。双链断裂可通过多种机制修复,常见的是非同源末端连接(NHEJ),即断裂两侧的 DNA 链利用双链断裂末端通常存在的单链突出直接重新连接。当断裂两侧的突出不匹配时,会发生错误,常导致核苷酸缺失,修复后的分子出现有效缺失。Cas9 在切割位点留下 5' 单核苷酸突出,<