SECONDGRAM:基于梯度调控的自条件扩散技术为纵向 MRI 数据填补与医学诊断带来新突破

《Patterns》:SECONDGRAM: Self-conditioned diffusion with gradient manipulation for longitudinal MRI imputation

【字体: 时间:2025年04月01日 来源:Patterns 6.7

编辑推荐:

  在神经退行性疾病研究中,纵向 MRI 数据集稀缺限制了机器学习应用。研究人员开展了 SECONDGRAM(自条件扩散与梯度操纵)研究,用该方法生成的后续 MRI 特征更逼真,提升了数据质量和诊断准确性,为精准医疗等领域提供了有效解决方案。

  在医学领域,磁共振成像(Magnetic Resonance Imaging,MRI)是一项至关重要的技术。它就像医生的 “透视眼”,能帮助发现帕金森病的早期迹象、监测肿瘤、评估软组织损伤等。不过,比起单次的 MRI 扫描结果,多次扫描呈现出的纵向变化蕴含着更多诊断和预后信息,对预测阿尔茨海默病、跟踪多发性硬化症进展、评估治疗效果等意义重大。
随着机器学习在医疗领域的广泛应用,利用其分析 MRI 图像成为热门研究方向。然而,虽然有大量用于训练单 MRI 相关模型的数据集,但包含配对初始和随访扫描的纵向 MRI 数据集却极为匮乏。这一数据限制就像一道 “紧箍咒”,严重阻碍了机器学习在关键序列任务中的应用,无法充分挖掘纵向 MRI 数据的潜在价值。

为了突破这一困境,来自美国伊利诺伊大学厄巴纳 - 香槟分校计算机科学系、美国国立卫生研究院阿尔茨海默病及相关痴呆症中心等机构的研究人员开展了一项重要研究,提出了自条件扩散与梯度操纵(Self - conditioned diffusion with gradient manipulation,SECONDGRAM)方法。相关研究成果发表在《Patterns》杂志上。

研究人员在这项研究中主要运用了以下关键技术方法:首先是基于几何布朗运动和随机波动率成分的扩散模型,通过迭代扩散和去噪过程来生成图像。具体而言,迭代扩散时,在 100 个噪声步骤中逐步给初始成像特征添加噪声,使其近似高斯分布,之后利用去噪扩散概率模型(Denoising Diffusion Probabilistic Model,DDPM)逆向去噪生成目标成像特征。其次,采用 UNet 自动编码器架构,对其进行适应性改造以处理一维成像特征向量。再者,引入自条件学习和梯度操纵技术,前者利用未配对图像数据增加训练数据多样性,后者通过操纵梯度防止过拟合,确保训练过程稳定。研究使用了英国生物银行(UK Biobank)数据集,这是世界上最大的长期生物医学数据库之一,包含 41,706 名患者的多方面数据,为研究提供了有力支撑。

下面来看具体的研究结果:

  • 近似随访成像:研究人员通过对比不同方法生成的随访成像特征与真实特征的相似性来评估模型性能。使用皮尔逊相关系数、欧几里得距离和余弦距离等指标进行衡量,结果显示 SECONDGRAM 表现优异,在各指标上均超越了基线方法。例如,在皮尔逊相关系数上,SECONDGRAM 达到 0.601±0.018,比最接近的非消融基线高出 20% ,表明它能更准确地模拟真实的随访 MRI 数据。
  • 捕获整体数据分布:除了关注成像特征的相似性,评估生成模型能否重现数据集的分布也很关键。研究人员通过测量弗雷歇距离(Frechet distance)和皮尔逊平均相关性等指标发现,SECONDGRAM 在捕获整体 MRI 分布方面表现出色。它的弗雷歇距离比任何非消融基线都低 28%,协变量相关性与真实数据的相似度比非消融基线高 33%,能更好地平衡捕获单变量分布和相关特征间的多元模式。
  • 丰富下游训练数据集:研究进一步探究了 SECONDGRAM 生成的数据对下游训练数据集的影响。以帕金森症和中风检测分类任务为例,用 SECONDGRAM 增强训练数据集后,模型在这些任务上的预测性能显著提升。在中风分类任务中,基于 SECONDGRAM 增强数据集训练的模型,其受试者工作特征曲线下面积(AUROC)比简单使用有限配对数据训练的模型提高了 10%,证明了该方法能有效丰富训练数据集,提升下游任务的预测能力。
  • 帕金森症案例研究:研究人员以帕金森症为例进行案例研究,分析患者大脑中黑质致密部(Substantia Nigra Pars Compacta,SNC)的体积变化。结果发现,SECONDGRAM 能够学习并重现帕金森病与 SNC 体积衰减之间的关联模式。尽管帕金森症患者数量较少(仅 107 例),但 SECONDGRAM 生成的成像特征显示,有帕金森病史的患者 SNC 体积衰减比无病史的患者平均多 30%,与真实数据中 34% 的比例相近,表明该模型能捕捉到真实的大脑和 MRI 随时间变化的模式。

在研究结论和讨论部分,SECONDGRAM 成功解决了纵向成像数据稀缺的问题。它通过自条件学习充分利用了大量未配对的 MRI 图像数据,同时利用梯度操纵增强了模型在有限数据下的鲁棒性。实验表明,SECONDGRAM 在有效填补数据、生成通用成像特征以及通过增强数据集提升下游任务实用性方面表现卓越。它不仅能准确模拟真实的随访 MRI 特征,还能丰富训练数据集,助力模型在各种下游任务中发挥更好的性能。虽然该研究受限于数据集仅处理了单个 MRI 对,但这种方法有望扩展到处理更多 MRI 数据,为医学成像领域带来更多可能。它为模拟现实的随访 MRI 特征、增强下游训练数据集提供了有效途径,为医疗记录的完善和下游任务的开展奠定了坚实基础,在医学成像领域展现出巨大的应用潜力,为未来的相关研究开辟了新的方向。

濞戞挸顑堝ù鍥┾偓鐟邦槹瀹撳孩瀵奸敂鐐毄閻庢稒鍔掗崝鐔煎Υ婵犲洠鍋撳宕囩畺缂備礁妫滈崕顏呯閿濆牓妯嬮柟娲诲幘閵囨岸寮幍顔界暠闁肩瓔鍨虫晶鍧楁閸撲礁浠柕鍡楊儐鐢壆妲愰姀鐙€娲ゅù锝嗘礋閳ь剚淇虹换鍐╃閿濆牓妯嬮柛鎺戞閻庤姤绌遍崘顓犵闁诡喓鍔庡▓鎴︽嚒椤栨粌鈷栭柛娆愬灩楠炲洭鎯嶉弮鍌楁晙

10x Genomics闁哄倹婢橀幖顪渋sium HD 鐎殿喒鍋撻柛姘煎灠瀹曠喓绱掗崱姘姃闁告帒妫滄ご鎼佹偝閸モ晜鐣遍柛蹇嬪姀濞村棜銇愰弴鐘电煁缂佸本妞藉Λ鍧楀礆閸℃ḿ鈧粙鏁嶉敓锟�

婵炲棎鍨肩换瀣▔鐎n厽绁癟wist闁靛棗锕g粭澶愬棘椤撶偛缍侀柛鏍ㄧ墱濞堟厤RISPR缂佹稒鐩埀顒€顦伴悧鍝ヤ沪閳ь剟濡寸€n剚鏆╅悗娑欏姃閸旓拷

闁告娲滅划蹇涙嚄閻愬銈撮幖鏉戠箰閸欏棝姊婚妸銉d海閻犱焦褰冮悥锟� - 婵烇絽宕崣鍡樼閸℃鎺撶鎼达綆鍎戝☉鎾亾濞戞搩浜滃畷鐔虹磼閸℃艾鍔掗悗鍦仱閻涙瑧鎷嬮幑鎰靛悁闁告帞澧楅弳鐔煎箲椤斿灝绐涢柟璨夊倻鐟㈤柛娆樺灥椤宕犻弽顑帡寮搁敓锟�

濞戞挸顑堝ù鍥Υ婵犲嫮鐭庨柤宕囧仜閸炴挳鎽傜€n剚顏ら悹鎰╁妺缁ㄧ増鎷呭⿰鍐ㄧ€婚柡瀣姈閺岀喎鈻旈弴鐘虫毄閻庢稒鍔掗崝鐔煎Υ閿燂拷

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号