国际疾病分类自杀表型在遗传学研究中的定义与评估:标准化表型提升跨队列数据可比性与统计效力
【字体:
大
中
小
】
时间:2025年10月04日
来源:Psychiatry Research 3.9
编辑推荐:
本文推荐:为解决自杀行为(Suicidality)表型定义异质性阻碍遗传学研究数据整合的问题,Psychiatric Genomics Consortium (PGC) Suicide Workgroup基于专家共识开发了国际疾病分类(ICD)自杀意念(SI)和自杀尝试(SA)表型定义代码列表。通过多队列验证(N=21,772)发现,ICD代码在真实世界数据中表现差异显著(SA灵敏度15.4%-71.1%,SI灵敏度29.4%-86.1%)。该研究为大规模遗传学研究提供了标准化表型定义框架,对提升跨数据集可比性和遗传发现可靠性具有重要意义。
自杀行为(Suicidality)是人类社会最严峻的精神健康挑战之一,涵盖自杀意念(Suicidal Ideation, SI)、自杀尝试(Suicide Attempt, SA)和自杀死亡(Suicide Death, SD)等一系列复杂且部分重叠的表型。家族和双生子研究显示,这些表型具有30-50%的遗传度,表明遗传因素在自杀风险中扮演重要角色。然而,像大多数精神疾病表型一样,自杀行为也是多基因遗传的,需要数十万样本才能进行充分统计效力的全基因组关联分析(Genome-Wide Association Study, GWAS)。这促使了大型研究联盟的形成,例如精神病学基因组学联盟(Psychiatric Genomics Consortium, PGC)。
但一个关键问题阻碍了研究进展:自杀行为表型定义的巨大异质性。不同研究和临床机构对SI和SA的定义、记录和编码方式存在显著差异,导致数据难以直接比较和整合。这种异质性不仅降低了遗传研究的统计效力,还可能掩盖真正的遗传信号。虽然患者报告的工具(如问卷和访谈)是定义表型的最佳来源,但许多大型现实世界数据集(如生物样本库和健康登记库)通常缺乏这些信息,只能依赖国际疾病分类(International Classification of Diseases, ICD)代码作为表型数据的唯一来源。因此,开发一套可靠、一致且基于ICD代码的自杀行为表型定义,对于推进大规模遗传学研究至关重要。
为了应对这一挑战,PGC自杀工作组在《Psychiatry Research》上发表了其最新研究成果。该研究旨在通过专家共识制定一套标准化的ICD代码列表,用于定义SI和SA表型,并评估这些代码在多个独立队列中的真实世界性能。
研究主要采用了以下几种关键技术方法:1) 专家共识法:由国际临床专家团队审阅和修改已有的ICD代码列表(如美国国家卫生统计中心的列表),通过多轮独立审查和小组讨论,最终确定两个SA定义列表(SA Narrow和SA Broad)和一个SI定义列表。2) 多队列验证:研究利用四个美国队列(总样本量N=21,772)进行验证,这些队列同时拥有ICD编码数据和哥伦比亚自杀严重程度评定量表(Columbia Suicide Severity Rating Scale, C-SSRS)的筛查结果或等效数据。队列包括以患有严重慢性精神疾病的退伍军人为特征的CSP572(分为研究入组前BE和入组后AE两个时间点)、从普通临床人群中筛选出的有自杀倾向个体的VUMC-SD,以及来自精神病学急症诊疗环境的VUMC-Psych。3) 性能评估指标:以C-SSRS等工具的结果作为金标准,计算ICD代码列表的灵敏度(Sensitivity)、特异性(Specificity)和阳性预测值(Positive Predictive Value, PPV)等性能指标。
研究人员最终生成了两个SA ICD代码列表:SA Narrow和SA Broad。SA Narrow列表旨在优化特异性和PPV,包含了大多数 intentional self-harm(故意自伤)代码和一部分被专家认为极有可能代表自杀行为(而非非自杀性自伤NSSI)的 undetermined intent(意图未定)代码。例如,它排除了通常与NSSI相关的重复性浅表切割或烧伤代码,而纳入了与自杀attempt更相关的代码,如特定类型的 poisoning(中毒)、drowning(溺水)、hanging(上吊)和 firearm(枪械)伤害。SA Broad列表则旨在提高灵敏度,包含了所有 intentional 和 undetermined self-harm代码,以及一些 accidental(意外)代码,作为更广泛、更包容的定义。
SI的定义仅依赖于两个ICD代码(ICD-9的V62.84和ICD-10的R45.851)。其性能在不同队列中差异很大。灵敏度最低的是CSP572-BE队列(29.4%),最高的是VUMC-Psych队列(86.1%)。特异性和PPV则相对稳定,范围分别在64.2%-90.6%和0.67-0.98之间。这表明,当临床医生使用这些特定代码时,它们通常能准确识别SI,但漏报率很高,尤其是在非急性精神病诊疗环境中。
三个SA列表(NCHS列表、SA Narrow、SA Broad)的性能同样因队列而异。灵敏度范围从CSP572-BE的15.2%(NCHS列表)到VUMC-SD的71.1%(SA Broad列表)。特异性和PPV则更为一致,范围分别为67.6%-96.7%和0.57-0.92。与预期一致,SA Narrow列表通常表现出更高的特异性和PPV,而SA Broad列表则具有更高的灵敏度。一个关键发现是,ICD代码的性能似乎更受数据来源和临床环境的影响,而不是所使用的特定列表。
队列间的比较揭示了ICD编码实践的巨大差异。在由患有慢性精神疾病的退伍军人组成的CSP572队列中,ICD代码对SA和SI的识别灵敏度都很低(SA: 15.2%-25.6%; SI: 29.4%-48.9%)。然而,在研究入组后进行系统筛查后(CSP572-AE),灵敏度有所提高,这表明系统筛查可以促进更全面的ICD编码。相反,在专门为识别自杀行为而选择的队列(VUMC-SD)或急性精神病环境(VUMC-Psych)中,灵敏度要高得多(SA: 30.7%-71.1%; SI: 56.8%-86.1%)。但VUMC队列的特异性通常较低,尤其是在使用SA Broad列表时。
按性别分层分析显示,在CSP572队列( predominantly male,主要为男性)中,男性SI的检测灵敏度和特异性通常高于女性。而在性别分布更均衡的VUMC队列中,则观察到相反或无明显差异的模式。这些差异的临床意义尚不清楚,但暗示了编码实践中可能存在潜在偏差或系统性差异。
研究的讨论部分深入分析了这些发现的意义。ICD代码在识别自杀行为方面普遍灵敏度较低,这意味着依赖ICD的研究会低估真实患病率,并将未识别的病例留在对照组中,从而稀释遗传效应,需要更大的样本量来检测显著关联。性能的巨大差异可归因于多种因素:缺乏统一的临床医生编码培训、患者病史记录的差异、保险报销要求、地域文化差异以及对编码法律责任的担忧。
研究人员建议,SA Narrow列表可作为高特异性定义用于GWAS等研究,以降低异质性。SA Broad列表则可用于需要更高灵敏度的临床或遗传研究。最终,选择取决于研究的具体目标和背景。重要的是,任何使用ICD定义的研究都应明确说明其标准并承认这些局限性。
该研究的结论是,PGC自杀工作组提出的ICD代码列表为改善遗传研究中自杀表型定义的一致性和可比性迈出了重要一步。然而,仅凭ICD代码的识别能力仍然有限。为了提高数据质量,需要在不同临床机构间推广使用此类标准定义并进行一致性编码培训。同时,结合自然语言处理(NLP)等先进技术可能有助于更有效地从电子健康记录中识别自杀风险。通过采用这些标准化定义并清晰报告研究方法,未来研究将能够产生更可靠、可重复的结果,最终推动我们对自杀行为遗传基础的理解,并为预防策略提供信息。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号