人类副同源基因合成致死的遗传图谱与预测模型构建
《Cell Reports》:Genetic mapping and predictive modeling of paralog synthetic lethality
【字体:
大
中
小
】
时间:2025年11月08日
来源:Cell Reports 6.9
编辑推荐:
本研究针对副同源基因合成致死相互作用系统性缺失的难题,通过大规模CRISPR-Cas12组合筛选技术,对36,648对人类副同源基因对进行功能解析。研究发现合成致死事件具有显著的细胞背景依赖性,并首次揭示共享蛋白互作网络(PPI)的规模与必需性共同决定合成致死强度。该研究为精准靶向副同源基因依赖关系提供了理论框架与预测工具,发表于《Cell Reports》。
在人类基因组中,副同源基因(paralogs)作为基因复制演化的产物,占据了基因家族的相当比例。这些基因因序列相似性高,常被认为具有功能冗余性,从而成为合成致死(synthetic lethality)研究的理想对象——即当其中一个基因失活时,细胞仍可存活,但同时失活两个基因则导致细胞死亡。这一特性尤其在癌症治疗中具有重要价值,因为肿瘤细胞中常发生特定基因的缺失,若其副同源基因被抑制,则可选择性杀伤肿瘤细胞而避免对正常组织的毒性。尽管这一概念已提出近百年,但由于人类副同源基因数量庞大(约13,320个,分属3,500个家族),系统性实验验证一直面临技术瓶颈。以往研究多聚焦于少量候选基因对,或依赖计算预测,缺乏全基因组范围的实证数据。此外,合成致死相互作用的渗透率(penetrance)在不同肿瘤背景中差异显著,其分子机制尚不明确。
为解决上述问题,Michael J. Flister团队在《Cell Reports》上发表了题为“Genetic mapping and predictive modeling of paralog synthetic lethality”的研究。该研究通过多重CRISPR-Cas12组合筛选技术,首次对人类基因组中36,648对副同源基因进行了系统性功能筛选,并结合49种癌症细胞模型的元分析,揭示了合成致死相互作用的异质性机制。研究人员进一步利用机器学习模型,发现共享蛋白互作网络(PPI)的必需性是决定合成致死强度的关键因素。
本研究主要依赖以下几项关键技术:首先,利用优化后的enAsCas12a酶构建多重引导RNA阵列文库,实现双基因敲除(dKO)的高通量筛选;其次,整合DepMap数据库中的单基因敲除数据,建立混合筛选策略以扩大细胞模型覆盖范围;此外,通过XGBoost和随机森林算法对多组学特征(如基因表达、体细胞突变、拷贝数变异等)进行机器学习建模,预测合成致死相互作用;最后,结合AlphaFold预测的蛋白结构相似性,进一步优化特征选择。
Mapping genetic interactions of 36,648 paralog pairs in the human genome
研究团队首先设计了一种CRISPR-Cas12多重引导文库,包含113,502个构建体,覆盖36,648对副同源基因。在NCI-H1299和MDA-MB-231细胞中进行筛选后,发现合成致死事件极为罕见(<0.4%),且在不同细胞系中重叠率低(仅0.06%)。通过正交验证(野生型AsCas12a筛选)和与“金标准”合成致死对比较,证实该文库具有高灵敏度和特异性(AUC=0.96)。此外,研究还发现了新型合成致死对,如热休克蛋白HSPA8/HSPA1A和HSPA8/HSPA1B,表明该筛选策略能有效识别家族内特异性相互作用。
Meta-analysis of paralog synthetic lethalities across cancer models
通过对20个癌症模型的混合筛选(CRISPR-Cas12 dKO数据与DepMap单基因敲除数据整合),共发现780对合成致死相互作用,其发生率在不同细胞系中差异显著(17–230对)。进一步整合两项已发表的CRISPR-Cas9筛选数据(共49个模型)后,发现仅HDAC1/HDAC2在80%的模型中显示合成致死效应,其余相互作用多为背景依赖性。XGBoost模型分析显示,基因表达特征是预测合成致死强度的主要因素,且相关通路富集于氧化应激、AKT信号等促存活途径。
Predicting paralog synthetic lethality
为解决合成致死预测中训练集不足的问题,研究团队构建了一种加权随机森林分类器,利用正负样本平衡训练策略,对223对高渗透率合成致死进行建模。结果显示,共享PPI网络的规模与必需性(如DepMap Chronos评分<-1的基因数量)是预测合成致死强度的核心特征。例如,常见合成致死对(如HDAC1/HDAC2)的共享PPI网络中平均包含19个必需基因,而罕见对仅含3个。这一发现首次将网络必需性与合成致死渗透率直接关联。
本研究通过迄今最大规模的副同源基因筛选,证实合成致死事件具有低发生率和高异质性的特点。机器学习模型进一步揭示,这种异质性源于副同源基因所嵌入的PPI网络的复杂性:当共享网络包含大量必需基因时,双基因失活更易引发系统性功能崩溃,导致合成致死效应广泛出现。此外,研究提出的混合筛选策略与加权预测模型,为多基因相互作用研究提供了新范式。然而,当前数据仍局限于二基因相互作用,未来需结合多基因敲除技术(如IN4MER平台)探索更高阶的遗传互作。总体而言,该研究不仅填补了人类副同源基因功能图谱的空白,也为肿瘤特异性靶向治疗提供了理论依据与工具支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号