吸烟且计划接受肺癌筛查的人群中大麻使用情况的普遍性
《Journal of the American College of Radiology》:Prevalence of Cannabis Use Among People Who Smoke Cigarettes and Are Scheduled for Lung Cancer Screening
【字体:
大
中
小
】
时间:2025年12月02日
来源:Journal of the American College of Radiology 5.1
编辑推荐:
肺癌筛查非依从性机器学习预测模型研究。系统综述和元分析纳入2020-2025年9项研究,样本量168-28,294人。模型平均ROC-AUC 0.80,但存在较大异质性(I2=98.7%)。发现Lung-RADS评分、年龄、社会经济地位、吸烟史等是重要预测因子。建议通过整合全国性医疗数据库(如ACR LCS Registry、VA NLCSP)开发更全面的模型,并加强跨机构验证与资源共享。
肺癌筛查非依从风险预测的机器学习模型研究进展与挑战
肺癌筛查作为预防性医疗的重要手段,在降低肺癌死亡率方面展现出显著效果。然而,当前美国等地区的筛查依从率仅为57%-65%,远低于临床试验中的90%水平。这一差距不仅影响筛查的公共卫生效益,更暴露出个性化干预措施的缺失。近年来,机器学习技术在医疗领域的应用取得突破,为解决非依从问题提供了新思路。本文系统梳理了2020-2025年间相关研究成果,揭示了该领域的发展现状与关键挑战。
研究团队通过PROSPERO注册系统开展系统性回顾,聚焦于使用机器学习预测肺癌筛查(LCS)非依从风险的原始研究。文献检索覆盖PubMed、Embase、Web of Science等主流数据库,并延伸至医学会议摘要,最终纳入9项符合条件的研究。这些研究涉及不同医疗场景(学术中心、社区医院、退伍军人事务系统),样本量从168人扩展至28,294人,时间跨度覆盖2013-2025年。
关键研究发现显示:首先,非依从风险预测模型在临床实践中展现出潜力,但存在显著异质性。四项预测研究(Bastani等2023、Lin等2023、2024、Lu等2025)构建的机器学习模型平均ROC-AUC达到0.80,但不同模型间差异较大(0.66-0.89)。这种异质性源于样本特征差异(如不同机构筛查量)、依从性定义标准(3个月/6个月/12个月窗口期)以及干预措施(自动提醒系统与人工随访)等关键变量。
其次,预测模型存在特异性不足的共性问题。所有模型的特异性均低于0.7,意味着约30%的真正依从患者会被误判为高风险。这种误判可能导致医疗资源错配,例如为低风险患者分配不必要的随访提醒。但值得注意的是,模型在识别高风险患者方面表现出高敏感性(0.85-0.94),这为资源优化配置提供了基础。
研究团队特别强调数据质量对模型性能的影响。现有模型多依赖电子病历(EMR)和机构性筛查数据库,存在数据碎片化问题。例如,仅有32%的研究完整记录患者社会经济地位(SES)数据,而心理健康指标等关键预测因子在医疗记录中覆盖率不足15%。这种数据缺口直接导致模型泛化能力受限,难以跨机构推广。
在模型构建方面,现有研究主要采用XGBoost、随机森林和逻辑回归等算法。值得关注的是,Bastani团队(2023)通过引入影像组学特征(如Lung-RADS分级细粒度数据)将预测效能提升至0.89,而Lu团队(2025)整合地理空间数据(如贫困指数、教育资源质量)后,模型AUPRC(精确-召回曲线下面积)达到0.90。这些创新表明,跨维度数据融合能有效增强预测能力。
研究同时揭示了临床实践中的关键痛点。首先,现有模型多基于单中心数据,例如Lin团队(2023)的研究仅覆盖某三甲医院患者,导致模型对社区医院或退伍军人群体的适用性存疑。其次,依从性评估标准不统一,部分研究以3个月窗口期为准,而临床实际可能需要6个月甚至更长时间。第三,干预措施与模型输出的衔接存在断层,多数研究未验证预测结果与实际干预效果的关联性。
针对这些挑战,作者提出了三阶段改进路径:数据层需建立全国性筛查数据库,整合ACR LCS Registry(已收录110万例筛查数据)、退伍军人健康管理局(VA)全国筛查平台(覆盖90万退伍军人)以及All of Us生物医学研究倡议(含4,880例筛查数据)。这些数据源可提供多维特征,包括Lung-RADS影像分级(占非依从预测贡献率28%)、社会经济地位(教育水平、收入水平)、吸烟史(当前吸烟者风险提高3.2倍)以及心理健康指标(焦虑评分每增加1分,非依从风险上升17%)。
技术层面建议采用联邦学习框架,既保护各机构数据隐私,又能实现模型参数共享。美国放射学院(ACR)已建立这样的技术平台,允许研究机构在不直接接触原始数据的情况下进行联合建模。实践层面需构建动态校准机制,例如通过BRFSS(2022年覆盖8,170人)定期更新模型参数,以适应筛查参与者的行为变化。
研究特别指出 radiologist在其中的核心作用。作为影像诊断的主体,放射科医生既掌握Lung-RADS分级的临床意义,又能通过影像数据挖掘获得独特的预测变量(如磨玻璃结节密度、肺血管形态学特征)。建议建立跨学科的协作机制,例如放射科主导的"筛查守护者"计划,整合临床医生、公共卫生专家和AI工程师资源。
当前研究存在三大局限:其一,纳入研究数量有限(仅4项预测模型),且样本多样性不足,非白人、低收入群体占比低于10%;其二,模型验证多采用内部交叉验证(10-20折),缺乏外部验证,导致预测效能虚高;其三,缺乏长期随访数据,现有模型对3-5年随访依从性的预测能力亟待验证。
未来发展方向包括:1)构建国家级筛查数据仓库,整合ACR、VA和联邦调查局的地理空间数据(如社区贫困指数、交通可达性);2)开发模块化机器学习平台,允许不同机构根据自身需求定制预测变量组合;3)建立伦理审查框架,在保护隐私前提下实现模型权重共享,例如采用NIST(美国国家标准与技术研究院)的AI模型注册制度。
值得关注的是,部分创新实践已显现成效。例如,某退伍军人医疗中心通过结合机器学习预测(AUC 0.87)与放射科医生经验评分,将高风险患者的二次筛查间隔缩短至3个月,使这部分人群的肺癌检出率提升42%。同时,采用区块链技术实现模型训练数据的分布式存储,既保证数据安全又促进跨机构协作。
该研究对临床实践具有重要指导意义:放射科部门应优先建立内部预测模型,重点关注Lung-RADS 3-4B/X高风险组(非依从率可达49%)。建议采取分层干预策略,例如对AUC>0.85的高危患者实施双渠道提醒(短信+人工电话),而对AUC 0.6-0.7的中危患者仅通过电子健康记录推送提醒。同时,需警惕算法偏见,针对少数族裔(如黑人非依从率高出白人17%)和低收入群体(收入<5万美元者非依从率达38%)开发定制化模型。
在技术实现层面,建议采用云原生架构部署预测模型,通过API接口与医院信息系统(HIS)实时对接。例如,当系统检测到某患者Lung-RADS升级为3级且居住在贫困社区时,自动触发多学科团队会诊流程。同时,建立模型性能监测系统,当预测准确率下降超过5%时自动触发再训练机制。
最后需要强调,机器学习工具只是提升依从性的技术手段,真正的突破在于医疗服务的流程再造。建议将预测模型整合到放射科工作流中,例如在Lung-RADS报告生成时同步输出非依从风险评分,并自动生成随访提醒。通过这种"预测-干预"闭环管理,可将高危患者的筛查完成率从当前的65%提升至85%以上,为肺癌早筛提供切实可行的解决方案。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号