FastCCC:一种无需排列的快速、稳健、基于参考的单细胞转录组细胞通讯分析新框架
《Nature Communications》:FastCCC: a permutation-free framework for scalable, robust, and reference-based cell-cell communication analysis in single cell transcriptomics studies
【字体:
大
中
小
】
时间:2025年12月14日
来源:Nature Communications 15.7
编辑推荐:
本研究针对单细胞转录组数据分析中细胞通讯(CCC)推断存在的计算瓶颈、模式单一和难以利用大规模参考数据等问题,开发了FastCCC这一创新性分析框架。该工具通过基于快速傅里叶变换的卷积技术实现p值的解析计算,避免了耗时的排列检验;引入模块化代数运算框架捕获多样CCC模式;并首次构建了包含1900万细胞的人类CCC参考面板,支持参考增强的CCC分析。应用表明FastCCC能高效分析百万级细胞数据,在COVID-19和胸腺发育等研究中揭示了有生物学意义的通讯事件。
在多细胞生物体中,细胞间通讯(Cell-Cell Communication, CCC)是协调发育、调节生物功能、维持稳态和响应外界刺激的基础。这些通讯通常以配体-受体相互作用(Ligand-Receptor Interactions, LRIs)的形式发生,即一个细胞释放的配体与另一个细胞表面的受体结合,触发下游信号事件。随着单细胞转录组测序技术的普及,解析细胞间通讯已成为理解组织微环境和疾病机制的关键。然而,现有的计算方法面临三大挑战:依赖耗时的排列检验计算统计学显著性;通讯评分模式单一,难以捕捉多样的相互作用模式;以及无法有效利用日益增多的大规模单细胞参考数据集来增强对用户收集的小规模数据的分析。
为了突破这些限制,来自耶鲁大学和密歇根大学的研究团队在《Nature Communications》上发表了FastCCC这一创新性分析框架。该工具通过三大核心技术革新了CCC分析范式:采用快速傅里叶变换(Fast Fourier Transform, FFT)为基础的卷积技术解析计算p值,避免了计算密集的排列过程;引入模块化代数运算框架,支持16种不同的通讯评分(Communication Score, CS)计算方式,能灵活捕捉从普遍到稀有的多种相互作用模式;首创参考引导的CCC分析理念,通过构建包含19种组织类型、450多种细胞类型、约1600万细胞的人类CCC参考面板,使研究人员能够借助大规模参考数据增强对小规模用户数据的分析能力。
在技术方法上,研究人员首先建立了通用的CCC统计检验框架,将通讯评分定义为配体表达摘要统计量与受体表达摘要统计量的函数。针对单亚基和多亚基配体/受体复合物,分别考虑了均值、中位数、第三四分位数、第90百分位数等多种表达摘要统计量,以及算术平均和几何平均两种相互作用强度度量方式。通过卷积运算和中心极限定理,推导出零假设下CS统计量的解析分布,从而实现无需排列的p值计算。为支持参考分析,团队从CELLxGENE平台整合了19个人类正常组织的单细胞数据,构建了首个综合性人类CCC参考面板,并采用基于排名的批次校正策略减少数据集间的技术偏差。
研究结果方面,首先通过与传统方法CellPhoneDB的对比验证了FastCCC的准确性。在包含40种细胞类型的教程数据上,FastCCC与运行100万次排列的CellPhoneDB结果高度一致(皮尔逊相关系数>0.988),且计算效率提升数百倍。在11个测试数据集上的评估表明,FastCCC在保持最低假阳性率(平均<1%)的同时,实现了最高的召回率,其F1分数和Matthews相关系数等指标均优于现有方法。
应用至大规模COVID-19数据集(146万细胞)时,FastCCC成功识别了与疾病严重程度相关的特异性CCC模式。严重病例中,上皮细胞与髓系细胞(如巨噬细胞、中性粒细胞等)的相互作用显著增强,其中ACE2-TMPRSS2通路以及上皮-间质转化(Epithelial-Mesenchymal Transition, EMT)标志物(如KRT5、ITGB6、VIM)的表达变化尤为突出。补体C3在严重病例的纤毛上皮、分泌上皮和AT2+上皮细胞中异常高表达,可能驱动异常免疫反应。此外,严重患者还表现出多种趋化因子(如CCL、CXCL)相关CCC的上调,暗示细胞因子风暴的发生。
在胸腺发育时间序列数据分析中,FastCCC通过数千个滑动时间窗口的动态CCC分析,揭示了T细胞发育不同阶段的关键信号事件。在双阴性(Double Negative, DN)早期阶段,NOTCH1/NOTCH3与DLK1/DLL4/JAG2等配体的强烈相互作用主导了T细胞谱系定向;而在单阳性(Single Positive, SP)阶段,CCR7-CCL19/CCL21信号轴介导的胸腺细胞迁移成为关键。研究还发现一种特定的树突状细胞亚型(aDCs)通过表达CCL17、CCL19和CCL22等配体,在胸腺微环境调控中发挥特殊作用。
参考为基础的CCC分析是FastCCC的另一大亮点。团队利用构建的人类CCC参考面板,对独立乳腺癌数据集进行分析,成功识别了癌细胞与免疫/基质细胞间的异常通讯。与正常组织相比,肿瘤中ICAM3-ITGB2/ITGAL等相互作用显著增强,而ANXA1-CXCR3、THBS1-ITGB1等相互作用则明显减弱。这些变化与肿瘤进展的相关通路(如PI3K-Akt信号、细胞黏附分子等)密切关联。特别在三阴性乳腺癌样本中,部分下调的LRIs不再显著,提示不同乳腺癌亚型间存在不同的微环境调控模式。
研究结论部分强调,FastCCC通过解析p值计算、模块化评分体系和参考引导分析三大创新,实现了CCC分析在速度、灵活性和可靠性上的质的飞跃。它不仅为大规模单细胞研究提供了高效工具,还通过参考分析范式增强了小规模数据集的研究能力,为比较生物学和转化医学研究开辟了新途径。未来整合空间转录组、表观遗传等多组学数据,将进一步拓展其在发育和疾病研究中的应用前景。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号