目前,虽然已知 CU 患者的临床病程存在差异,包括活跃期、临床缓解期和复发期,但对于不同患者亚组的详细信息却知之甚少。此前的研究在临床缓解和复发模式方面存在诸多不确定性,比如患者达到临床缓解的比例和复发率各不相同,影响临床缓解和复发的因素也未完全明确,不同患者的临床特征与缓解、复发模式之间的关系也不清晰,这些都使得 CU 的管理面临挑战。
为了解开这些谜团,来自多个机构的研究人员开展了一项重要研究。他们利用 Optum? 去识别化电子健康记录(EHR)数据集(2007 - 2018 年),对大量 CU 患者进行研究。该研究旨在通过聚类分析描述不同 CU 临床缓解和复发模式的代表性患者特征,并进一步分析共病负担、治疗情况和资源利用情况。此研究成果发表在《Dermatology and Therapy》杂志上。
研究人员主要采用了以下关键技术方法:首先,利用 Optum? 去识别化电子健康记录数据集,该数据集包含了美国 2000 多家护理中心超 100 万人的临床信息,为研究提供了丰富的数据资源。其次,采用回顾性队列研究设计,确定成年 CU 患者的样本。然后,运用一种数据驱动的聚类算法 —— 分裂层次聚类方法对患者进行分组,并通过 k - prototype 算法进行聚类分析,同时对变量进行重新缩放,以确保分析结果的准确性,还用留出集进行模型验证。
研究通过聚类分析区分出四种具有不同临床缓解和复发模式的患者聚类,明确了不同聚类患者的特征差异。这不仅有助于深入了解 CU 的临床过程,还为开发预测模型提供了依据,帮助临床医生更好地预测高风险患者,实现个性化疾病管理,为 CU 患者的治疗和管理带来了新的希望和方向。同时,研究也指出了自身存在的局限性,如 ICD 编码可能导致误分类、数据受保险覆盖期限制等,为后续研究提供了改进方向。