《Genome Medicine》:Predicting MHC-I ligands across alleles and species: how far can we go?
编辑推荐:
研究人员为精准预测 MHC-I 配体开展研究,发现人类和小鼠预测精度高,其他物种较低。
在人体的免疫系统中,CD8
+T 细胞如同训练有素的 “警察”,时刻监视着身体内细胞的状况。当细胞受到病原体感染或者发生癌变时,CD8
+T 细胞会迅速识别并消灭这些异常细胞。而这一过程的关键,在于 CD8
+T 细胞能够识别呈现在 I 类主要组织相容性复合体(MHC-I)分子上的抗原肽(epitope)。这些抗原肽就像是细胞发出的 “危险信号”,被 CD8
+T 细胞精准捕捉。
在疾病治疗领域,尤其是癌症免疫治疗中,MHC-I 配体发挥着至关重要的作用。它们可以作为个性化疫苗的关键成分,激活免疫系统,让免疫细胞更精准地识别并攻击癌细胞。然而,目前 MHC-I 配体的研究面临着巨大挑战。已知的人类和小鼠 MHC-I 等位基因有数千种,但只有几百种常见等位基因有大量的配体数据。对于绝大多数其他 MHC-I 等位基因,其配体仍然未知,这就如同在黑暗中摸索,严重阻碍了相关疾病治疗的发展。
为了打破这一困境,来自瑞士洛桑大学路德维希癌症研究所、瑞士生物信息学研究所等多个机构的研究人员(Daniel M. Tadros、Julien Racle 和 David Gfeller 等)开展了一项深入研究,相关成果发表在《Genome Medicine》杂志上。
研究人员利用了一种扩展架构的 MHC-I 配体预测器(MixMHCpred3.0),通过一系列复杂而精妙的技术方法,系统地评估 MHC-I 配体预测在不同等位基因和物种中的应用程度。首先,他们从人类、小鼠、牛、犬和非人灵长类动物的 250 多个 MHC-I 肽组学样本中收集了天然呈现的 MHC-I 配体。这些样本如同珍贵的 “拼图碎片”,为后续研究提供了重要基础。接着,他们构建了 MHC-I 结合基序(binding motifs)和肽长度分布(peptide length distributions),这一步就像是为每个 MHC-I 等位基因绘制了独特的 “身份标签”。然后,利用神经网络预测 MHC-I 结合基序和肽长度分布,进而预测 MHC-I 配体。为了验证预测的准确性,研究人员进行了留一法交叉验证(leave-one-allele-out cross-validation)等多种验证实验。
研究结果令人振奋。MHC-I 肽组学数据使得预测未知配体的 MHC-I 等位基因的结合特异性成为可能。在留一法交叉验证中,预测结果比随机猜测要好得多,尤其是人类等位基因的预测表现优于其他物种。例如,对于大多数人类 MHC-I 等位基因,预测的结合基序与实际非常相似,而其他物种的预测准确性相对较低。这表明,人类的 MHC-I 等位基因在预测方面具有独特的优势。
进一步研究发现,结合位点相似性(binding site similarity)决定了 MHC-I 配体预测的准确性。当一个等位基因与已知配体的等位基因的结合位点距离小于 0.1 时,能够实现准确的 MHC-I 配体预测。在人类中,超过 97% 的 HLA-I 等位基因满足这一条件,这意味着大部分人类 MHC-I 等位基因的配体预测是可靠的。然而,在其他物种中,大多数没有已知 MHC-I 配体的等位基因无法通过结合位点距离的阈值,预测准确性较低。这可能是因为这些物种的 MHC-I 结合位点存在新的氨基酸或新的氨基酸排列方式,使得预测变得困难。
在与其他常用的泛等位基因方法(如 NetMHCpan4.1、MHCflurry2.0 和 BigMHC)的对比中,MixMHCpred3.0 展现出了强大的性能。无论是在对特定等位基因的预测,还是在使用外部数据集进行的更现实的数据测试中,MixMHCpred3.0 都取得了较高的准确性。这表明 MixMHCpred3.0 是一种先进的泛等位基因 MHC-I 配体预测器。
此外,MixMHCpred3.0 还能够准确预测 CD8+T 细胞表位。研究人员通过重新训练免疫原性预测器 PRIME,得到了 PRIME2.1,进一步验证了 MixMHCpred3.0 在 CD8+T 细胞表位发现中的有效性。
综合来看,这项研究意义重大。它表明对于绝大多数人类 MHC-I 等位基因以及实验室小鼠品系的 MHC-I 等位基因,都可以实现非常准确的 MHC-I 基序和配体预测。同时,研究还揭示了其他物种预测准确性的分子决定因素,为后续研究指明了方向。MixMHCpred3.0 的开发和应用,为个性化疫苗设计、癌症免疫治疗等领域提供了有力的工具,有助于推动生命科学和健康医学的发展。
研究人员在研究中用到了多种关键技术方法。首先是数据收集,从人类、小鼠、牛、犬和非人灵长类动物的 250 多个 MHC-I 肽组学样本中收集天然呈现的 MHC-I 配体;然后利用神经网络分别预测 MHC-I 结合基序和肽长度分布;最后通过留一法交叉验证评估预测性能,并与其他预测器进行对比。
研究结论表明,MixMHCpred3.0 可以准确预测大多数人类和小鼠 MHC-I 等位基因的配体,但在其他物种中的预测准确性较低。这主要是由于不同物种 MHC-I 结合位点的差异导致的。在讨论部分,研究人员指出,虽然基于 AUC 值评估预测性能存在一定局限性,但结合基序和肽长度分布可以作为评估预测器性能的重要指标。此外,MixMHCpred3.0 在实际应用中,尤其是在人类样本的研究中,具有很高的价值,能够为 CD8+T 细胞表位发现提供有力支持。这一研究成果为深入理解 MHC-I 配体的预测机制,以及开发更有效的免疫治疗策略奠定了坚实的基础。
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》