CRISPR-Cas系统进化分类新蓝图:罕见变体的发现与功能解析
《Nature Microbiology》:An updated evolutionary classification of CRISPR–Cas systems including rare variants
【字体:
大
中
小
】
时间:2025年11月07日
来源:Nature Microbiology 19.4
编辑推荐:
本期《Nature Microbiology》推荐一项突破性研究:为应对CRISPR-Cas系统多样性快速扩张的挑战,Koonin团队联合多国科学家开展了迄今为止最全面的CRISPR-Cas系统进化分类更新。研究整合基因组与宏基因组数据,构建包含2类、7型和46个亚型的分类框架,揭示了III型系统的环寡腺苷酸信号通路多样性及罕见变体(如靶向DNA的IV型、非切割型V型)的功能特性。该分类为CRISPR生物学研究提供了标准化工具,并凸显了原核生物防御系统进化的“长尾分布”特征。
在微生物与病毒永无休止的军备竞赛中,CRISPR-Cas系统作为原核生物的“免疫记忆库”,持续展现出惊人的进化创新能力。然而,随着基因组和宏基因组数据爆炸式增长,传统的分类框架已难以涵盖新发现的系统变体,尤其是那些罕见却功能独特的类型。这就像绘制一幅不断扩张的星系地图,许多暗淡的“恒星”尚未被标注坐标。
为此,来自美国国立卫生研究院等机构的Kira S. Makarova与Eugene V. Koonin团队联合全球30余位顶尖学者,在《Nature Microbiology》发表了最新分类研究。他们通过大规模计算生物学分析,将CRISPR-Cas系统划分为2大类(Class 1多蛋白效应复合体与Class 2单蛋白效应体)、7个型和46个亚型,较5年前的分类新增1个型(VII型)和13个亚型。研究首次系统阐释了III型系统的环寡腺苷酸(cOA)信号通路分类,并发现IV型变体可切割DNA靶标、V型变体可通过非切割机制抑制靶标复制。
研究基于47,545个完整原核基因组和NCBI非冗余数据库,采用MMseqs2聚类、PSI-BLAST谱分析和多序列比对构建Cas蛋白系统发育树。通过AlphaFold2/3预测蛋白结构与复合物组装,结合CRISPRCasFinder鉴定CRISPR阵列,最终通过基因组邻域分析确定CRISPR-cas基因座边界与模块组成。
新增的VII型系统主要存在于古菌中,其效应蛋白Cas14由β-CASP家族RNase与Cas10样结构域融合而成,通过crRNA依赖的RNA切割机制靶向转座元件。III型系统新增III-G、III-H和III-I三个亚型,其中III-G和III-H丢失了Cas10的环化酶活性,而III-I的Cas10高度分化且与III-E的Cas7-11e独立进化出多结构域效应蛋白Cas7-11i。
研究揭示了III型系统cOA信号通路的组合多样性:11个CARF(CRISPR-associated Rossmann fold)传感器家族(Crf1-11)可激活HEPN RNase、PIN核酸酶等多种效应结构域,而Crn1-Crn5环化核苷酸酶负责信号衰减。III-B和III-D系统可能通过CorA样膜蛋白感知SAM-AMP信号,但其效应机制尚不明确。
II-D亚型包含已知最小Cas9蛋白,广泛分布于DPANN超门古菌;V型系统新增6个亚型,其中Cas12g可同时靶向ssRNA和ssDNA,Cas12a2通过非切割性DNA结合阻断转录;VI-E和VI-F亚型扩展了RNA靶向能力,Cas13e可能是VI型系统的祖先形态。
CRISPR-Cas系统在嗜热菌中富集(加权流行率84-90%),而新发现变体仅占完整基因组中系统的0.3%,符合“长尾分布”规律。进化分析表明,CRISPR-Cas系统通过效应模块重组、转座子招募(如I-F3 CAST)以及防御功能转向(如III型系统信号通路)持续创新。
该分类框架为探索CRISPR-Cas系统的进化逻辑和工程化应用奠定了基石。未来研究将聚焦于极端环境中的稀有变体挖掘、人工智能辅助的功能预测,以及CRISPR系统被移动遗传元件(MGEs)征用的非免疫功能解析。正如作者所言:“我们已经绘制了CRISPR星系的主序星,但那些暗物质般的罕见变体仍将引领下一轮探索浪潮。”
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号