### 研究背景:肺癌困境与影像组学挑战
肺癌,这个隐匿在健康暗处的 “杀手”,近年来愈发猖獗。在过去十年间,由于环境污染加剧、吸烟率居高不下以及诊断技术的进步,肺癌的发病率和死亡率节节攀升。2018 年,全球癌症观察组织(GLOBOCAN)预测,当年有超 176 万人因肺癌离世,新发病例超 200 万,相较于 2012 年的数据,增长态势令人揪心。肺癌不仅是男女中常见的癌症,更是死亡率最高的恶性肿瘤之一。
在非小细胞肺癌(NSCLC)的治疗领域,虽然免疫疗法、化疗和分子靶向疗法等取得了显著突破,但晚期诊断、治疗耐药和复发等难题,依旧让 NSCLC 患者的治愈和生存率处于低位。而在手术切除的 NSCLC 病例中,淋巴管浸润(LVI)被视为高风险病理特征,若能精准判断 LVI,就能为 I 期患者划分风险等级,进而优化辅助治疗方案。
影像组学,作为从医学影像中挖掘隐藏信息的新兴技术,在疾病预测、诊断和治疗反应评估等方面展现出巨大潜力。不过,NSCLC 的影像分析面临重重挑战。肺部的自然运动以及肿瘤与移动结构的邻近关系,使得影像呈现复杂多变的状态。肿瘤大小、位置和周围肺实质的差异,进一步增加了影像分析和特征提取的难度。运动伪影的存在,就像给影像 “蒙上一层纱”,模糊了细节,影响了定量影像组学特征的准确性,导致特征的重复性和再现性备受质疑。
为了突破这些困境,来自麦吉尔大学(McGill University)等机构的研究人员开展了一项意义重大的研究,相关成果发表在《Cancer Imaging》杂志上。
研究方法:模拟与实战的结合
研究人员首先自制了一个胸部模型,内置两个直径 22mm 的球形病灶,通过特定的电机模拟肺部呼吸运动,在两个正交方向上移动,模拟真实的临床场景。同时,收集了 126 例 NSCLC 患者的临床数据,这些患者均经过活检确诊,且 LVI 状态明确。
在影像分析阶段,研究人员利用基于模糊 C 均值(FCM)的分割算法,对临床和模型影像中的病灶进行精准分割。之后,从每个感兴趣区域(ROI)提取 105 个三维影像组学特征,这些特征涵盖形状、一阶、二阶及高阶纹理特征等四大类。
为筛选出对运动稳健的特征,研究人员计算了每个特征在运动和静态状态下的组内相关系数(ICC),将 ICC 大于 75% 的特征认定为稳健特征。此外,研究人员运用了多种特征选择算法,如 Boruta、递归特征消除(RFE)和最小冗余最大相关(MRMR),并结合逻辑回归(LR)、XGBoost(XGB)、多层感知器(MLP)、朴素贝叶斯(NB)和随机森林(RF)等机器学习分类器,对 LVI 进行预测。
研究结果:稳健特征的优势与局限
- 特征筛选结果:从 105 个影像组学特征中筛选出 24 个对肺运动稳健的特征。多个特征选择算法多次选中的特征,如 original_glrlm_RunLengthNonUniformity、original_shape_MeshVolume 和 original_ngtdm_Coarseness 等,展现出较强的稳健性和潜在的预测能力。
- 预测性能对比:在预测 LVI 的性能方面,使用稳健特征作为输入时,多数情况下会降低预测的准确性(ACC)和曲线下面积(AUC),但能显著提升敏感性(SEN)。例如,LR 分类器结合 MRMR 特征选择,使用稳健特征后,敏感性从 0 提升至 83% 以上,而 AUC 从 87% 降至 92%;MLP 分类器结合 MRMR 特征选择,敏感性从 0 提升至 42%,AUC 从 94% 降至 66%。在特异性(SPE)方面,使用稳健特征会使所有模型的特异性下降。
- 模型最佳性能:不考虑影像组学特征稳健性时,NB 分类器和 RFE 特征选择的组合取得最高 AUC(95%),LR 分类器和 RFE 特征选择、XGB 分类器和 Boruta 特征选择的组合获得最高 ACC(89%);使用稳健特征后,LR 分类器和 MRMR 特征选择、NB 分类器和 Boruta 特征选择的组合达到最高 AUC(92%),NB 分类器和 Boruta 特征选择的组合获得最高 ACC(86%),且 NB 分类器在使用稳健特征进行特征选择后,敏感性达到 100%。
研究结论与讨论:稳健特征的价值与展望
本研究表明,在影像组学研究中,考虑特征对各种影响因素的稳健性至关重要。虽然使用稳健特征会在一定程度上牺牲预测的准确性和 AUC,但大幅提升的敏感性在医学应用中意义重大,尤其是在癌症诊断和预后评估方面,高敏感性可以减少漏诊,为患者争取宝贵的治疗时机。
然而,研究也发现,当前的特征选择算法在充分考虑特征稳健性方面存在不足,仅少数稳健特征被选中,这意味着算法可能过度关注统计相关性,忽视了临床实用性和特征的可重复性。未来需要开发更先进的特征选择算法,使其能更好地识别既具有预测能力又具备可靠重复性的特征。
此外,本研究样本量有限,未来需更大规模的研究来验证结果。同时,影像组学特征还受多中心数据等多种因素影响,后续研究应进一步探索这些因素。在技术应用上,深度学习或深度影像组学中稳健特征的使用也是未来研究的方向,有望为 NSCLC 的精准诊疗带来新的突破。
娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴f洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀
10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�
濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�
閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞e崬鍙嗘禍鍡毿掓禒搴n儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�
娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�