UCLA(University of California, Los Angeles,加利福尼亚大学洛杉矶分校 )的 Elinor Lee 等人在《Orphanet Journal of Rare Diseases》期刊上发表了题为 “The healthcare burden of pulmonary alveolar proteinosis (PAP)” 的论文。这篇论文对于深入了解肺泡蛋白沉积症(PAP,Pulmonary Alveolar Proteinosis)这一罕见肺部疾病领域有着至关重要的意义,它为该疾病的临床诊疗、医疗资源分配以及后续研究提供了关键的数据支持和方向指引。
肺泡蛋白沉积症是一种极为罕见的肺部综合征,其主要特征是肺泡内表面活性物质异常积聚。这一现象会严重阻碍气体交换,引发一系列肺部症状,还会使患者更容易受到常见病原体和机会性病原体的二次感染。PAP 主要分为原发性、继发性和先天性三种类型。原发性 PAP 中,粒细胞 - 巨噬细胞集落刺激因子(GM - CSF,Granulocyte - Macrophage Colony - Stimulating Factor)信号通路遭到破坏,这可能是由于 GM - CSF 自身抗体水平升高(自身免疫性),也可能是因为涉及 GM - CSF 受体的基因突变(遗传性),其中自身免疫性 PAP 最为常见,约占病例总数的 90%。继发性 PAP 与多种全身性疾病相关,比如血液系统恶性肿瘤(最常见的是骨髓增生异常综合征)、免疫缺陷综合征,或者是有毒物质吸入暴露,这些因素会间接影响肺泡巨噬细胞的数量和功能。先天性 PAP 则是由对表面活性物质产生至关重要的基因突变引起的,像表面活性物质相关蛋白 B(SFTPB,Surfactant - Associated Protein B)、表面活性物质相关蛋白 C(SFTPC,Surfactant - Associated Protein C)以及 ATP 结合盒蛋白 3(ABCA3,ATP - Binding Cassette Protein 3)等基因。
尽管目前对 PAP 的病理生理学有了一定的了解,但在临床诊断和治疗过程中仍面临诸多挑战。PAP 的临床症状缺乏特异性,相关检测手段有限,且目前还没有获得批准的特效疗法。美国国家 PAP 登记处的一项研究显示,患者从出现症状到准确诊断 PAP,平均会延误 1.5 年。在诊断过程中,往往需要进行多项检查和操作,包括肺功能测试、动脉血气分析、胸部 X 光、CT 扫描,以及支气管肺泡灌洗细胞学检查和 / 或肺组织病理学检查。许多患者在诊断过程中还需要接受经支气管活检或外科肺活检。
这些挑战给 PAP 患者及其家庭带来了沉重的负担,同时也对医疗系统造成了较大压力。此前的研究虽然已经发现 PAP 患者相比对照人群存在更高的合并症发生率、更多的医疗资源利用以及更高的医疗费用,但样本数量有限。为了更全面、深入地了解 PAP 患者的医疗负担情况,本次研究旨在更大规模的美国人群队列中对这些发现进行验证和拓展,同时利用机器学习技术探索医疗系统中可能未被诊断的 PAP 患者。
研究采用回顾性队列分析方法。研究期间为 2018 年 1 月 1 日至 2023 年 5 月 1 日。PAP 患者的纳入标准为:在 2019 年 1 月 1 日至 2022 年 5 月 1 日的索引期内,至少有 1 次索赔记录的诊断代码为 PAP(ICD9 - CM 代码:516.0 或 ICD - 10 - CM 代码:J84.01);在研究期间,最后一次 PAP 诊断代码之后没有其他罕见呼吸系统疾病的索赔记录。对于在索引期内有 PAP 诊断代码的患者,最早与 PAP 诊断代码相关的索赔日期被定为索引日期;若患者在索引期内没有 PAP 诊断代码,则将 2019 年 1 月 1 日作为索引日期。
为了进行对比,研究人员按照 1:4 的比例为每位 PAP 患者匹配了非 PAP 对照患者,匹配因素包括年龄、性别和地理位置,并且对照患者的索引日期与匹配的 PAP 患者相同。此外,为了确保研究对象的一致性和数据的有效性,PAP 患者和对照患者都必须在索引日期前 12 个月(基线期)和后 12 个月(随访期)有持续的索赔活动(每 6 个月至少有 1 次索赔记录),不符合该标准的患者将被排除在分析之外。
研究人员还运用了 IPM.ai 的机器学习技术来识别可能未被诊断的 PAP 患者。该机器学习算法是基于一组已确诊 PAP 患者的 “训练” 数据开发的。这些训练数据中的患者需满足:在整个索赔历史中,至少有 2 次索赔记录的诊断代码为 PAP;在索赔历史中,最后一次 PAP 诊断代码之后没有其他罕见呼吸系统疾病的索赔记录。机器学习算法会分析训练队列的整个索赔历史,识别出 PAP 患者独特的诊断、医疗和治疗索赔模式,然后根据这些模式对 IPM.ai 数据库中的其他约 3 亿患者进行评分。研究中的机器学习队列包含得分最高的患者,这些患者与已确诊的 PAP 患者相似,并且他们的索赔历史中需要有训练队列中常见的操作记录(如支气管镜检查、支气管肺泡灌洗或全肺灌洗),以此作为筛选标准,降低假阳性预测率。研究人员使用了多种指标(如曲线下面积(AUC,Area Under the Curve)、精确度、召回率以及与基线模型的性能对比)对机器学习模型进行客观评估,结果显示该模型的 AUC 为 0.89,具有很强的预测能力,但由于算法可能存在的局限性,机器学习队列未被纳入本研究的主要分析。
在统计分析方面,研究人员将基线期和随访期测量的临床特征、操作和治疗使用结果以频率形式报告,随访期测量的 HCRU 指标结果则使用均值、标准差、中位数和四分位数间距进行报告。通过独立 T 检验计算 PAP 队列和对照队列在临床特征、操作、治疗使用、HCRU 均值指标和成本之间的 P 值,以比较两组之间的差异。
研究结果
基线人口统计学和临床特征:经过纳入标准筛选后,本研究共确定了 2312 名 PAP 患者和 9247 名对照患者。匹配后,两组在年龄()和性别()方面没有显著差异。PAP 患者中女性居多(占 68%),平均年龄为 61±17.75 岁,约 75% 的患者年龄在 45 岁及以上。超过一半(63%)的 PAP 患者为非西班牙裔白人,9% 为西班牙裔,6% 为黑人或非裔美国人。PAP 患者中 36% 有医疗保险(Medicare)覆盖,30% 有商业保险覆盖。PAP 患者的平均 CCI 得分(1.44±1.96)显著高于对照队列(0.41±1.11)(span data-custom-copy-text="\(P0.05\)")。在基线时,31% 的 PAP 患者被诊断患有慢性阻塞性肺疾病(COPD,Chronic Obstructive Pulmonary Disease),而对照队列中这一比例仅为 8%(span data-custom-copy-text="\(P0.001\)")。此外,PAP 队列中糖尿病(21% vs. 9%;span data-custom-copy-text="\(P0.001\)")、肾脏疾病(13% vs. 4%;span data-custom-copy-text="\(P0.001\)")、充血性心力衰竭(13% vs. 3%;span data-custom-copy-text="\(P0.001\)")、非转移性恶性肿瘤(11% vs. 5%;span data-custom-copy-text="\(P0.001\)")和外周血管疾病(11% vs. 3%;span data-custom-copy-text="\(P0.001\)")的发生率也显著高于对照队列。机器学习模型识别出了另外 4147 名可能未被诊断的 PAP 患者,但这些患者未被纳入主要分析。
随访期间的合并症:在随访期间,PAP 队列中其他呼吸系统疾病(61% vs. 19%;span data-custom-copy-text="\(P0.001\)")、高血压(49% vs. 22%;span data-custom-copy-text="\(P0.001\)")、高脂血症(36% vs. 17%;span data-custom-copy-text="\(P0.001\)")、精神疾病(29% vs. 11%;span data-custom-copy-text="\(P0.001\)")、肥胖(19% vs. 7%;span data-custom-copy-text="\(P0.001\)")以及虚弱或疲劳(17% vs. 7%;span data-custom-copy-text="\(P0.001\)")的诊断率均显著高于对照队列。
随访期间的操作:随访期间,40% 的 PAP 患者有胸部影像学检查的索赔记录,而对照队列中这一比例仅为 10%(span data-custom-copy-text="\(P0.001\)")。PAP 患者在氧气治疗(15% vs. 1%;span data-custom-copy-text="\(P0.001\)")、肺功能测试(12% vs. 1%;span data-custom-copy-text="\(P0.001\)")、COVID - 19 检测(12% vs. 4%;span data-custom-copy-text="\(P0.001\)")、肺活量测定(8% vs. 1%;span data-custom-copy-text="\(P0.001\)")、支气管镜检查(8% vs. 0%;span data-custom-copy-text="\(P0.001\)")、移动辅助设备使用(6% vs. 2%;span data-custom-copy-text="\(P0.001\)")、支气管肺泡灌洗(5% vs. 0%;span data-custom-copy-text="\(P0.001\)")、全肺灌洗(2% vs. 0%;span data-custom-copy-text="\(P0.001\)")和胸腔镜检查(1% vs. 0%;span data-custom-copy-text="\(P0.001\)")等操作的发生率上均显著高于对照队列。
随访期间的药物使用:随访期间,PAP 患者使用抗生素的比例(20%)是对照队列(8%)的两倍多(span data-custom-copy-text="\(P0.001\)")。PAP 患者使用吸入性 β 受体激动剂(15% vs. 4%;span data-custom-copy-text="\(P0.001\)")、吸入性抗胆碱能药物(7% vs. 1%;span data-custom-copy-text="\(P0.001\)")、吸入性支气管联合疗法(6% vs. 1%;span data-custom-copy-text="\(P0.001\)")和吸入性类固醇(3% vs. 1%;span data-custom-copy-text="\(P0.001\)")的比例也显著高于对照队列。此外,PAP 患者使用沙格司亭(sargramostim)、其他呼吸疗法药物、呼吸生物制剂和利妥昔单抗的比例也高于对照患者。
随访期间的医疗资源利用:对 HCRU 指标的均值计算显示,PAP 患者在各个医疗场景中的互动率均较高。87% 的 PAP 患者有门诊就诊记录,而对照队列中这一比例为 56%。PAP 患者急诊就诊(35% vs. 14%)和住院就诊(20% vs. 5%)的利用率也更高。PAP 患者的门诊就诊次数(10.7±10.9 vs. 4.0±7.0;span data-custom-copy-text="\(P0.001\)")、急诊就诊次数(1.0±2.3 vs. 0.29±1.0;span data-custom-copy-text="\(P0.001\)")、住院就诊次数(2.3±7.8 vs. 0.38±2.5;span data-custom-copy-text="\(P0.001\)")以及住院天数(2.8 天 ±7.6 天 vs. 0.56 天 ±2.9 天;span data-custom-copy-text="\(P0.001\)")均显著高于对照患者。
本研究分析了 2312 名确诊的 PAP 患者和 9247 名匹配的对照患者的数据,这是目前美国在该领域分析的最大数据集。研究结果清晰地表明,与非 PAP 患者相比,PAP 患者的疾病医疗负担明显更重。PAP 患者不仅合并症发生率更高,医疗资源利用更频繁,而且在药品和非药品方面的花费也更高。这主要是由于目前在 PAP 的诊断和治疗方面存在诸多问题,比如对疾病的认识不足、缺乏有效的诊断检测手段,以及现有治疗方法大多只能缓解症状,无法从根本上改变疾病进程。
该研究结果与之前针对美国一小部分 PAP 患者(249 名确诊患者)的流行病学研究以及基于美国索赔数据库对 PAP 患者住院成本的研究结果相互补充,进一步验证了 PAP 患者相比对照人群在合并症发生率、医疗资源利用和医疗费用方面的差异。有趣的是,本研究中 PAP 患者队列和对照队列均显示女性多于男性,但在各项研究参数中并未发现性别差异。这与之前一些研究中发现的 PAP 男性占主导的结论不同,可能是因为美国女性比男性更倾向于使用医疗系统,从而使索赔数据中的女性比例偏高。同时,近期关于 PAP 患者队列和美国 PAP 患者登记处的研究也表明,PAP 患者的性别分布可能更为均衡,因此还需要更多研究来确定 PAP 患者是否存在真正的性别偏好。
通过机器学习模型,研究人员发现了可能存在数千名未被诊断的 PAP 患者,这意味着大量患者可能没有得到及时、恰当的治疗。尤其是对于自身免疫性 PAP 患者,目前有一种高度敏感和特异性的简单血清检测方法,可用于检测 GM - CSF 自身抗体,这种检测方法能够降低诊断成本,减少像肺活检等侵入性检测带来的风险,对明确自身免疫性 PAP 的诊断至关重要。
不过,本研究也存在一些局限性。例如,索赔数据集依赖专业的 ICD 编码,编码可能存在不准确或诊断遗漏的情况。部分数据收集发生在 COVID - 19 大流行期间,这可能导致一些结果被低估,因为大流行期间患者获取必要医疗服务的机会减少,一些门诊就诊、诊断操作和治疗可能被延迟或取消。此外,仅依靠 ICD 编码无法区分不同类型的 PAP 综合征,而不同类型的 PAP 患者在合并症和医疗资源利用方面可能存在差异。
尽管存在这些局限性,本研究依然具有重要意义。它为 PAP 患者的医疗负担提供了全面、详细的数据支持,有助于医疗工作者更深入地了解 PAP 患者的实际情况,为优化医疗资源分配提供依据。同时,研究中发现的未被诊断患者群体,也为未来的研究和临床工作指明了方向,即需要进一步提高对 PAP 的诊断意识,完善诊断方法,开发更有效的治疗手段,以减轻 PAP 患者的疾病负担,改善患者的生活质量,缓解医疗系统的压力。