MIST:深度解析 T 细胞奥秘,开启免疫研究新篇章 —— 一种可解释且灵活的单细胞 T 细胞转录组和受体分析深度学习框架

《SCIENCE ADVANCES》:MIST: An interpretable and flexible deep learning framework for single–T cell transcriptome and receptor analysis

【字体: 时间:2025年04月05日 来源:SCIENCE ADVANCES 11.7

编辑推荐:

  为解决当前单细胞 RNA 测序(scRNA-seq)和单细胞 T 细胞受体测序(scTCR-seq)联合分析存在的问题,研究人员开展了关于开发新分析工具增强 T 细胞生物学整合分析的研究。他们引入 MIST 框架,证明其具有可解释性和灵活性,为 T 细胞免疫功能研究提供了新视角。

  在生命科学的微观世界里,T 细胞作为免疫系统的关键 “战士”,其功能的深入探究一直是免疫学研究的重要课题。T 细胞的功能很大程度上受其 T 细胞受体(TCR)影响,TCR 能识别抗原并传导信号,启动下游生物学过程。随着单细胞测序技术的发展,单细胞 RNA 测序(scRNA-seq)和单细胞 T 细胞受体测序(scTCR-seq)能够在单细胞分辨率下描绘转录组和 TCR 特征,为深入理解 T 细胞功能提供了有力工具。然而,目前多数研究在联合分析 scRNA-seq 和 scTCR-seq 数据时存在缺陷,大多将二者视为相对独立的过程,主要基于 TCR 克隆型进行基因表达(GEX)和 TCR 的联合分析。而且现有的相关算法和工具也各有不足,比如克隆型邻居图分析(CoNGA)和 Tessa 依赖于所有具有相同 TCR 克隆型的 T 细胞具有相似转录组谱这一假设,但在不同个体、组织、批次以及复杂疾病微环境中的 T 细胞并不一定符合;单细胞网络对齐工具(scNAT)虽利用深度学习将数据合并到联合潜在空间,但缺乏对 GEX 和 TCR 的单独潜在表示,模型也缺乏可解释性。
为了突破这些困境,来自未知研究机构的研究人员开展了一项重要研究,他们引入了 MIST(Multi-insight for T cell),这是一种可解释且灵活的深度学习框架,用于单细胞 T 细胞转录组和受体分析。该研究成果发表在《SCIENCE ADVANCES》上,为 T 细胞免疫功能研究开辟了新道路。

研究人员在这项研究中用到了多个关键技术方法。首先,MIST 基于变分自编码器(VAE)架构,将输入数据编码为潜在空间变量,并通过解码器重建原始数据。在处理数据时,利用了自注意力机制和完全连接神经网络机制对数据进行解析。对于数据的处理,scRNA-seq 数据经 scanpy 处理,筛选细胞和基因、归一化表达等;scTCR-seq 数据经 scirpy 质控,保留特定 T 细胞并处理序列。此外,通过多种分析方法如主成分分析(PCA)、聚类分析等对数据进行深入挖掘。

下面来看具体的研究结果:

  • MIST 用于转录组和 TCR 整合:MIST 可分别计算来自 GEX、TCR 和联合潜在空间的表示,用于 T 细胞功能表征。它能同时处理多个单细胞转录组和 TCR 数据集,并自动消除批次效应。通过对 10x Genomics 的数据集分析发现,MIST 能有效重建 GEX 和 TCR 数据,且随着训练周期增加,重建的准确性提高。
  • 单细胞 GEX 分析:将 MIST 应用于 10x_200k 数据集,其 GEX 编码器有效去除了 scRNA-seq 的批次效应,通过主成分分析、降维可视化和细胞聚类,将细胞分为八个簇。同时,GEX 编码器的自注意力层能提供生物学意义的见解,基因到细胞的注意力权重可用于注释细胞簇,基因到基因的注意力权重反映了基因的共表达关系。
  • TCR 的解释:MIST 的 TCR 编码器能将 TCR 序列转化为有生物学意义的嵌入表示,训练后的氨基酸嵌入能反映 CDR3 序列中氨基酸的特性。TCR VAE 创建的潜在 128D TCR 表示可用于降维和可视化,其 UMAP 图将 T 细胞分组为稀疏簇,部分簇与转录组功能注释对应。
  • T 细胞 GEX 和 TCR 的联合分析:对 10x_200k 数据集的 T 细胞计算联合潜在空间,其 UMAP 图显示,幼稚 T 细胞簇保持完整,记忆和细胞毒性 T 细胞簇结构改变。通过分析抗原特异性数据发现,联合潜在空间能更有效地模拟 T 细胞间的相似性,且 T 细胞的记忆亚群与特定抗原特异性相关,同时联合表示编码了复合转录组和抗原特异性特征。
  • 非小细胞肺癌(NSCLC)中 T 细胞的表征:利用 MIST 分析接受抗程序性细胞死亡蛋白 1(PD-1)治疗的 NSCLC 患者的 T 细胞,GEX 编码器再次有效去除批次效应。联合潜在空间用于下游分析时,T 细胞被分为 12 个簇,且联合表示与 TCR 表示更相似,这表明在特定生物环境中 T 细胞功能受 TCR 克隆型影响较大,同时也证明了 TCR 和联合潜在空间能有效编码 TCR 序列。
  • 识别抗 PD-1 特异性 T 细胞:在 NSCLC 抗 PD-1 治疗数据集中,通过对联合潜在空间衍生的 T 细胞簇分析发现,簇 5 - 9 的细胞几乎都来自对抗 PD-1 治疗有反应的肿瘤,且这些细胞高表达 CXCL13。进一步研究发现,簇 1 中的 CXCL13+T 细胞与簇 5 - 9 的功能不同,提示除 CXCL13 外还需考虑其他标记物来准确判断 T 细胞对治疗的反应,同时 MIST 可用于预测免疫治疗预后。
  • 发现重症 / 危重症 COVID-19 患者特异性 T 细胞:分析 COVID-19 患者的外周血单个核细胞(PBMC)的 scRNA-seq 和 scTCR-seq 数据,MIST 的 GEX 潜在嵌入聚类有效,KNN 预测器能准确分类细胞。联合潜在嵌入聚类发现,簇 22、23 和 24 的细胞来自 COVID-19 患者比例高,干扰素(IFN)反应评分高,且这些簇高表达 KLRK1 等基因,反映了 MIST 在揭示 T 细胞独特见解方面的实用性。

综合上述研究结果,MIST 作为一种专为 T 细胞 scRNA-seq 和 scTCR-seq 数据整合分析设计的深度学习模型,具有诸多优势。它通过联合表示学习全面的 T 细胞多模态模型,有效整合 GEX 和 TCR 特征,为单细胞测序数据分析提供了多种关键功能。其模块化设计将 GEX 和 TCR 投影到各自潜在空间,结合自然语言处理技术,增强了可解释性。与其他算法和工具相比,MIST 更加灵活、可解释且稳健,在多种场景下展现出独特价值。不过,MIST 也存在一些局限性,如无法基于一种模态生成另一种模态数据,训练时间相对较长。但总体而言,MIST 为在单细胞分辨率下分析 T 细胞提供了强大的框架,有助于深入理解 T 细胞生物学及其在健康和疾病中的作用,为免疫相关疾病的研究和治疗提供了新的有力工具,推动了生命科学和健康医学领域的发展。

濠电偞鍨堕幐鎼侇敄閸緷褰掑炊閳规儳浜鹃柣鐔煎亰濡插湱鈧鎸哥€涒晝鈧潧銈搁弫鍌炴倷椤掍焦鐦庨梺璇插缁嬫帡宕濋幒妤€绀夐柣鏃傚帶杩濇繝鐢靛Т濞茬娀宕戦幘鎰佹僵鐎规洖娲ㄩ悾铏圭磽閸屾瑧顦︽俊顐g矒瀹曟洟顢旈崨顖f祫闂佹寧绻傞悧鎾澄熺€n喗鐓欐繛鑼额嚙楠炴﹢鏌曢崶銊ュ摵鐎殿噮鍓熼獮宥夘敊閻e本娈搁梻浣藉亹閻℃棃宕归搹顐f珷闁秆勵殕椤ュ牓鏌涢幘鑼槮濞寸媭鍨堕弻鏇㈠幢濡ゅ﹤鍓遍柣銏╁灡婢瑰棗危閹版澘顫呴柣娆屽亾婵炲眰鍊曢湁闁挎繂妫欑粈瀣煃瑜滈崜姘┍閾忚宕查柛鎰ㄦ櫇椤╃兘鏌ㄥ┑鍡欏ⅵ婵☆垰顑夐弻娑㈠箳閹寸儐妫¢梺璇叉唉婵倗绮氶柆宥呯妞ゆ挾濮烽鎺楁⒑鐠団€虫灁闁告柨楠搁埢鎾诲箣閿旇棄娈ュ銈嗙墬缁矂鍩涢弽顓熺厱婵炲棙鍔曢悘鈺傤殽閻愬弶鍠橀柟顖氱Ч瀵噣宕掑Δ浣规珒

10x Genomics闂備礁鎼崐鐟邦熆濮椻偓楠炴牠鈥斿〒濯爄um HD 闁诲孩顔栭崰鎺楀磻閹剧粯鐓曟慨妯煎帶閻忕姷鈧娲滈崰鎾舵閹烘骞㈡慨姗嗗墮婵啴姊洪崨濠傜瑨婵☆偅绮嶉妵鏃堝箹娴g懓浠㈤梺鎼炲劗閺呮粓鎮鹃柆宥嗙厱闊洤顑呮慨鈧┑鐐存綑濡粓濡甸幇鏉垮嵆闁绘ḿ鏁搁悡浣虹磽娴e憡婀版俊鐐舵铻為柛褎顨呯粈鍡涙煕閳╁啞缂氶柍褜鍏涚划娆撳极瀹ュ鏅搁柨鐕傛嫹

婵犵數鍋涘Λ搴ㄥ垂閼测晜宕查悗锝庡亞閳绘棃鎮楅敐搴″箺缂佷胶娅墂ist闂備線娼уΛ妤呮晝閿濆洨绠斿鑸靛姇濡ɑ銇勯幘璺轰粶缂傚秳绶氶弻娑㈠冀閵娧冣拡濠电偛鐗婇崢顥窱SPR缂傚倷鐒︾粙鎺楁儎椤栫偛鐒垫い鎺嗗亾妞わ缚鍗抽幃褔宕妷銈嗗媰闂侀€炲苯澧村┑鈥愁嚟閳ь剨缍嗛崜姘跺汲閳哄懏鍊垫繛鎴炵懃婵啴鏌涢弮鎾村

闂備礁鎲¢〃鍡椕哄⿰鍛灊闊洦绋掗崵鍕煟閹邦剦鍤熼柕鍫熸尦楠炴牠寮堕幋鐘殿唶闂佸憡鐟ュΛ婵嗩潖婵犳艾惟闁靛绲煎ù鐑芥煟閻樿京鍔嶇憸鏉垮暣閹儵鏁撻敓锟� - 婵犵數鍎戠徊钘夌暦椤掑嫬鐭楅柛鈩冡缚椤╂煡鏌涢埄鍐惧毀闁圭儤鎸鹃々鐑藉箹鏉堝墽绉甸柛搴㈠灥閳藉骞橀姘濠电偞鍨堕幖鈺傜濠婂啰鏆﹂柣鏃囨绾惧ジ鏌涢埄鍐闁告梹甯¢幃妤呭捶椤撶偘妲愰梺缁樼⊕閻熝囧箯鐎n喖绠查柟浼存涧閹線姊洪崨濠傜濠⒀勵殜瀵娊鎮㈤悡搴n唹濡炪倖鏌ㄩ悘婵堢玻濞戙垺鐓欓悹銊ヮ槸閸婂鎮烽姀銈嗙厱婵炲棙锚閻忋儲銇勯銏╁剶鐎规洜濞€瀵粙顢栭锝呮诞鐎殿喗鎮傞弫鎾绘晸閿燂拷

濠电偞鍨堕幐鎼侇敄閸緷褰掑炊椤掆偓杩濇繝鐢靛Т鐎氼噣鎯屾惔銊︾厾鐎规洖娲ゆ禒婊堟煕閻愬瓨灏﹂柟钘夊€婚埀顒婄秵閸撴岸顢旈妶澶嬪仯闁规壋鏅涙俊铏圭磼閵娧冾暭闁瑰嘲鎳庨オ浼村礃閵娧€鍋撴繝姘厸閻庯綆鍋勬慨鍫ユ煛瀹€鈧崰搴ㄥ煝閺冨牆鍗抽柣妯挎珪濮e嫰鏌f惔銏⑩姇闁告梹甯″畷婵嬫偄閻撳宫銉╂煥閻曞倹瀚�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号