T 细胞受体 α 链 CDR3 结构多样性新发现:打破传统认知,助力免疫研究

【字体: 时间:2025年03月05日 来源:Communications Biology 5.2

编辑推荐:

  为解决 T 细胞受体(TCR)结构预测及 α 链 CDR3(CDR3α)结构研究难题,研究人员分析 TCR 结构数据,发现 CDR3α 结构复杂且难预测,为相关研究提供依据。

  在人体的免疫系统中,T 细胞受体(TCR)就像一个个训练有素的 “卫士”,时刻守护着身体的健康。它们通过与抗原(如主要组织相容性复合体呈递的肽,pMHC)相互作用,来启动 T 细胞介导的适应性免疫反应,在对抗癌症和其他疾病方面发挥着关键作用。然而,目前在早期药物研发和免疫组库规模的信息学研究中,TCR 的结构却未得到充分利用。
一方面,现有的 TCR:pMHC 特异性预测方法大多仅依赖序列特征,虽然将结构信息纳入模型有助于学习更通用的互补物理化学原理,但获取和生成 TCR 结构信息面临诸多挑战,比如可用的 TCR 结构数据量少,实验获取成本高。另一方面,许多预测模型只考虑 TCR 的 β 链信息,而 TCR 是由 α 和 β 链组成的异二聚体,这种做法可能会导致重要信息的丢失。此外,TCR 的互补性极难预测,现有的计算模型难以对未知数据进行有效预测。

为了攻克这些难题,来自英国牛津大学统计系和 Immunocore Ltd. 的研究人员展开了深入研究。他们的研究成果发表在《Communications Biology》上,为 TCR 结构研究带来了新的突破。

研究人员在此次研究中主要运用了以下关键技术方法:

  1. 数据处理与模型训练:补充公开数据,使用 Immunocore 的内部 TCR 结构数据扩充训练集,重新训练 TCRBuilder2 模型得到 TCRBuilder2+。
  2. 结构预测与评估:将 TCRBuilder2 + 与其他多种模型进行对比,通过计算均方根偏差(RMSD)等指标评估模型对 TCR 结构预测的准确性。
  3. 结构分析与聚类:对 TCR 结构进行聚类分析,研究 CDR3αCDR3β 的结构多样性及序列与结构的关系。

下面来看具体的研究结果:

  1. 整理和分析补充的 TCR 结构数据集:补充数据后,训练集包含 881 个 TCR 结构,其中 524 个序列非冗余。研究发现,TCR 结构数据存在基因偏好性,且 CDR3α 和 CDR3β 的序列与结构同一性之间的关系复杂。低序列同一性时,结构距离相关性弱;高序列同一性时,虽有一定相关性,但相同序列的 CDR3α 和 CDR3β 仍可能存在较大结构偏差。同时,CDR3α 和 CDR3β 在结构多样性上相似,CDR3α 的结构复杂性超出了其遗传重组机制所暗示的程度。
  2. 评估前沿 TCR 结构预测模型:重新训练得到 TCRBuilder2+,并与其他模型进行基准测试。结果显示,TCRBuilder2+、Alphafold Multimer 和 Alphafold3 在整体测试集中表现相近,但 CDR3α 和 CDR3β 的预测误差仍较大。不同模型对不同基因的预测准确性存在差异,TCRBuilder2 + 对新训练集中样本更多的基因预测准确性更高。此外,研究还发现 CDR3α 比 CDR3β 更难预测,即使结合不同模型的最佳预测结果,CDR3α 的结构仍难以准确预测,这凸显了其结构的复杂性。
  3. 150 万个 TCR 结构预测助力基于结构的深度学习研究:利用 TCRBuilder2 + 的计算效率,研究人员预测了超过 156 万个来自观察到的 T 细胞受体空间(OTS)数据库的非冗余 TCR 序列的结构。分析发现,TCR 的 CDR1 和 CDR2 环能聚成规范形式,而 CDR3α 和 CDR3β 则不能。与抗体的 CDR3L 相比,TCR 的 CDR3α 结构多样性更高,这进一步证实了 CDR3α 结构复杂性与 CDR3β 相当的结论。
  4. CDR3α 结构多样性的潜在解释:研究人员通过研究 CDR3α 和 CDR3β 的序列分布发现,CDR3α 序列能按同一性聚类,而 CDR3β 序列则不能。CDR3β 的中心区域变异性比 CDR3α 更大,但二者的小残基比例相似,都可能具有一定的灵活性。进一步研究发现,TRAV - TRAJ 基因对 CDR3α 结构的确定性高于 TRBV - TRBJ 基因对 CDR3β 结构的确定性,且 α 链的潜在组合多样性大于 β 链,这可能是 CDR3α 结构多样性的重要来源。

研究结论和讨论部分指出,将结构信息纳入 TCR 特异性预测方法具有重要意义,但目前 TCR 结构数据稀缺,计算预测虽有帮助,但仍需提高准确性。研究发现 CDR3α 和 CDR3β 在结构多样性和预测难度上相似,这与传统观点中认为 CDR3β 在决定抗原识别中起主导作用不同,强调了 TCRα 和 β 链在抗原特异性识别中可能具有同等重要的作用,也凸显了配对链测序数据的价值。此外,TCR 结构预测准确性的提高将有助于下游任务,如特异性预测和对接模拟,但当前模型在预测无抗原结合的 TCR(apo TCR)结构时可能存在困难。TCRBuilder2 + 能实现高通量预测,但要进一步提高预测准确性,可能需要从根本上改进方法。此次研究为 TCR 结构研究提供了新的视角,有助于推动免疫组库结构免疫信息学领域的发展,对理解 T 细胞免疫反应机制、开发新型免疫疗法具有重要的指导意义。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号