缓解脑部MRI数据中扫描仪之间的差异性:评估其对关联分析的影响以及ComBat协调技术在多站点神经影像学研究中的有效性

《NeuroImage》:Mitigating Inter-Scanner Heterogeneity in Brain MRI Data: Assessing Its Impact on Association Analyses and the Effectiveness of ComBat Harmonization in Multi-Site Neuroimaging Studies

【字体: 时间:2025年12月12日 来源:NeuroImage 4.5

编辑推荐:

  多站点神经影像研究中,扫描器异质性(如设备、参数差异)显著影响数据分析和统计效力。本研究通过整合995个多模态脑成像指标(BIMs)和超大规模中国人群影像遗传学(CHIMGEN)数据集,系统评估了ComBat和谐化方法在消除异质性及提升关联分析效果中的作用。结果显示:1)功能连接(FC)相关BIMs异质性最高,而灰质体积等结构指标异质性最低;2)ComBat有效校正了83.7%的BIMs异质性,但对FC相关指标校正效果有限;3)未经校正的 mega-analysis易产生虚假阳性,而ComBat校正后显著提升关联检测的稳健性。研究证实ComBat是处理多站点数据异质性的有效方法,但需结合BIM类型和协变量调整策略。

  
本研究的核心目标是评估多站点神经成像数据中的扫描器效应(inter-scanner heterogeneity)及其对数据分析的影响,并验证ComBat调和方法在解决此类问题中的有效性。研究基于两个数据集:数据集1包含两个旅行者通过28台不同扫描仪获取的多模态MRI数据,用于量化扫描器效应;数据集2来自中国成像遗传学(CHIMGEN)联盟,包含7,035名健康志愿者的多模态MRI数据和197项人口统计学及行为学变量(DBVs),用于分析扫描器效应对关联分析结果的影响。

### 1. 研究背景与问题提出
神经成像研究的快速发展促使多站点数据收集成为常态,但不同扫描仪的硬件差异(如磁共振场强、梯度线圈设计)和成像参数(如扫描时间、重建算法)会导致数据异质性,进而影响统计结果的可信度。已有研究指出,扫描器效应可能导致假阳性或假阴性,尤其在功能连接(FC)等动态指标中更为显著。然而,现有方法多针对单一模态或小规模数据集,缺乏对多模态、大规模数据的系统评估。

### 2. 研究方法与数据预处理
#### 2.1 数据集与指标构建
研究使用两套数据集:
- **数据集1**:包含两位旅行者(24-25岁)的28台扫描仪数据,涵盖T1加权(T1w)、扩散张量成像(DTI)、动脉自旋标记(ASL)和静息态功能磁共振(rs-fMRI)等多模态数据,提取995个脑成像指标(BIMs),包括:
- **结构指标**:灰质体积(VBM)、皮质表面积、厚度及曲率等(共48个)。
- **扩散指标**:FA、MD、RD、AK等(共21个)。
- **功能指标**:ALFF、fALFF、ReHo、功能连接密度(FCD)和强度(FCS)等(共594个区域级和401个体素级指标)。

- **数据集2**:来自CHIMGEN联盟的7,035名健康青年(18-30岁),包含上述多模态BIMs及197项DBVs(如年龄、教育年限、酒精使用评分等)。

#### 2.2 扫描器效应量化
采用内类相关系数(ICC)评估扫描器间一致性:
- **ICC计算**:基于28台扫描仪的BIM数据,计算每项指标的ICC值(范围0-1),并按制造商和扫描仪型号分组分析。
- **异质性分类**:将ICC值分为五类(极低0.2以下、低0.2-0.4、中0.4-0.6、高0.6-0.8、极高0.8-1),结果显示:
- **结构指标**(如灰质体积)ICC最高(0.996),**功能连接指标**(如FCS、FCD)ICC最低(0.03-0.10)。
- **体素级指标**的异质性普遍高于区域级指标,可能与局部磁场不均及体素信号波动有关。

#### 2.3 ComBat调和方法验证
- **调和流程**:对数据集1的BIMs应用ComBat算法,通过迭代加权调整消除扫描器效应。
- **效果评估**:
- **ICC提升**:调和后,83%的区域级指标和53%的体素级指标的ICC提升超过0.2,其中FA(0.8001)和灰质体积(0.9963)提升幅度较小,而FC相关指标(如FCD、FCS)提升显著(部分ICC从0.03增至0.40以上)。
- **标准化方法对比**:z-score标准化对降低异质性效果有限(部分ICC提升仅0.1),而GSR(全局信号回归)在功能指标中表现更优。

### 3. 关联分析中的扫描器效应影响
#### 3.1 关联分析方法
- **Meta分析**:独立计算每台扫描仪的BIM-DBV关联,合并效应量(随机效应模型)。
- **Mega分析**:直接合并多站点原始数据(未调和, mega-pre)或调和后数据(mega-post)。
- **对比策略**:评估三类方法(meta、mega-pre、mega-post)的效应量一致性、重叠率(CAT曲线)及显著关联分布(Venn图)。

#### 3.2 关键发现
1. **扫描器效应对关联分析的影响**:
- **未调和数据(mega-pre)**:在稀疏关联场景(如DBV与BIM仅少数区域/体素显著相关)中, mega-pre常产生大量假阳性(如AC_Num_036指标关联数达89/89,但经去极值处理后降至15/89)。
- **调和后数据(mega-post)**:ComBat有效减少假阳性(如FCS_z_abs_GSR关联数从12降至6),同时保留或增强真实关联(如FC_Reg_108_NGSR关联数从3增至17)。

2. **ComBat的适用性与限制**:
- **适用场景**:对多数BIM(如ALFF、DTI FA)调和后ICC提升显著(0.3-0.9),且能提高mega分析与meta分析的共识(重叠率从50%提升至80%)。
- **例外情况**:
- **AC_Num类指标**:包含DBV作为协变量时, mega-post可能消除真实关联(如AC_Num_036关联数从89降至0)。
- **功能连接指标**:FC_Vol、FCD等仍存在较高异质性(ICC调和后仍低于0.4),可能与时间稳定性差(如默认网络活动)和局部磁场干扰有关。

### 4. 理论意义与实践启示
#### 4.1 扫描器效应的异质性模式
- **结构指标**:受扫描仪硬件差异影响小(如灰质体积ICC达0.996),可能与解剖结构的稳定性有关。
- **功能指标**:动态信号易受扫描参数影响(如ALFF ICC仅0.10),需更严格的数据预处理(如去噪、标准化)。
- **扩散指标**:FA和MD的异质性中等(0.4-0.6),可能因白质纤维追踪算法差异导致。

#### 4.2 ComBat的优化与挑战
- **优势**:
- 对83%的区域级和53%的体素级指标提升ICC超过0.2。
- 在稀疏关联场景(如DBV与BIM仅3%区域显著)中,mega-post的假阳性率降低60%。
- **局限性**:
- **协变量选择**:若DBV本身存在扫描器差异(如教育水平因地区而异),需在ComBat中排除干扰。
- **功能连接的稳定性**:部分FC指标(如FCS_f_neg_NGSR)调和后仍存在异质性,可能与时间依赖性信号或局部磁场不均有关。

### 5. 未来研究方向
1. **方法扩展**:对比ComBat与其他调和方法(如ANCOVA、深度学习模型)在多模态数据中的表现。
2. **数据结构优化**:开发针对旅行者设计的ComBat变体(如考虑重复测量的协方差结构)。
3. **生物效因保留评估**:通过模拟实验或外部验证数据,量化ComBat对真实生物信号的保留能力。
4. **硬件兼容性建议**:建议多站点研究优先选择同型号扫描仪(如全部为GE或Siemens设备),并增加扫描仪间对比实验。

### 6. 总结
本研究首次系统量化了多模态BIMs的扫描器效应,并验证ComBat在混合异质性数据中的有效性。结果显示:
- **结构指标**受扫描器效应影响最小,适合直接跨站点分析。
- **功能连接指标**需额外处理(如去噪、协变量调整),ComBat可部分消除异质性但无法完全解决。
- **调和后关联分析**显著优于传统meta分析,尤其在稀疏关联场景中能减少60%以上假阳性。
- **实践建议**:多站点研究中应优先使用同型号扫描仪,对功能指标需结合DBV协变量分析,并警惕AC_Num类指标的过度调和。

本研究为多站点神经成像数据的标准化提供了关键参考,但需结合具体研究设计(如模态组合、样本量)选择最佳调和策略。后续研究应关注深层次生物效因与扫描器效应的交互作用,以及新型AI驱动的调和方法的应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号