遗传性视网膜变性相关变异在人群中的低外显率挑战传统认知
《AJHG》:Low population penetrance of variants associated with inherited retinal degenerations
【字体:
大
中
小
】
时间:2025年12月23日
来源:AJHG 9.8
编辑推荐:
本研究针对传统遗传性视网膜变性(IRD)研究中因表型筛选偏倚导致的外显率高估问题,利用All of Us和UK Biobank两大生物样本库的基因组与临床数据,通过反向遗传学方法系统评估了IRD相关基因变异在人群层面的实际外显率。研究发现,携带明确IRD致病基因型的个体中,仅9.4%-28.1%表现出相关临床表型,远低于既往接近100%的假设。这一低外显率现象提示IRD的发生需要遗传或环境修饰因子的共同作用,且人群中有0.7%-2.1%个体携带IRD兼容基因型,远高于患病率。该结果对IRD的遗传咨询、基因检测解读及治疗策略开发具有重要指导意义。
在眼科遗传病领域,遗传性视网膜变性(IRD)一直是导致工作年龄成年人失明的主要原因。长期以来,医学界普遍认为IRD是典型的单基因遗传病,其致病基因变异具有近乎完全的外显率,即携带致病基因变异个体几乎必然会发病。然而,这种认知很大程度上源于传统的研究方法——研究者通常先收集具有典型IRD临床症状的患者,再对他们的基因进行分析。这种方法虽然高效地发现了大量致病基因,但也埋下了一个隐患:它可能无意中筛选出了那些致病性最强、外显率最高的变异,从而高估了这类变异在普通人群中的实际致病风险。这种因表型筛选引入的偏倚,使得我们对IRD真实遗传规律的理解可能存在显著偏差。
随着大型生物样本库的兴起,如美国的“我们所有人”(All of Us, AoU)计划和英国生物样本库(UK Biobank, UKB),科学家们获得了前所未有的研究资源。这些样本库收集了数十万志愿者的基因组数据并链接了其电子健康记录(EHR),为采用“反向遗传学”研究策略提供了条件。这种新思路允许研究者从基因出发,先在大规模人群中识别携带特定基因变异的个体,再追溯其临床表型,从而能够更客观地评估基因变异在真实世界人群中的外显率。
在此背景下,由Kirill Zaslavsky、Elizabeth J. Rossin和Eric A. Pierce等领导的研究团队,在《美国人类遗传学杂志》(The American Journal of Human Genetics)上发表了一项开创性研究。他们利用AoU和UKB两大生物样本库的数据,首次在人群层面系统量化了被认为以孟德尔方式遗传的IRD相关基因变异的外显率。研究结果令人惊讶:这些“致病”变异在人群中的外显率远低于传统认知,揭示了IRD遗传机制的复杂性和对修饰因子的依赖性。
为开展此项研究,研究人员首先从RetNet和OMIM数据库筛选出与IRD相关的基因列表,并从中提取经ClinVar数据库注释为致病(P)或可能致病(LP)的变异。利用AoU项目v.8版本中317,964名同时拥有短读长全基因组测序(srWGS)数据和电子健康记录的参与者数据,研究人员通过严格的质控和人工审核,最终筛选出481名携带“明确IRD兼容基因型”的个体构成核心研究队列。关键方法还包括:定义了三个嵌套的国际疾病分类(ICD)代码集(“IRD集”、“视网膜病变集”和“筛查集”)以估算外显率的下限和上限;通过计算疾病注释频率(DAF)来量化外显率;并利用UK Biobank中携带相同变异的参与者的眼部光学相干断层扫描(OCT)和彩色眼底照相数据,对基于EHR的估计结果进行表型验证。
在481名携带明确IRD兼容基因型的AoU参与者中,仅有45人(9.4%)被EHR中的特异性“IRD”代码集所标注。即使使用最宽泛的“筛查”代码集,标注比例也仅为28.1%(135人)。这三个嵌套代码集的DAF均显著高于其在AoU总人群中的基线患病率,表明EHR代码确实能捕获真实的IRD信号,但同时也证实了基因型的外显率确实很低(9.4%-28.1%)。
研究队列中最常见的致病基因包括PRPH2、CRX、RHO、RPGR、BEST1和RP1。基因特异性分析显示,PRPH2、RPGR及相关变异在三个代码集中均显示出显著富集,而BEST1和RP1则未显示任何代码集的显著富集。即使在富集最显著的RPGR基因中,使用筛查集时的DAF也仅为40%。这些数据强调了IRD致病基因型普遍存在低外显率的现象。
为验证EHR结果的可靠性,研究团队在UK Biobank中找到了68名携带与AoU队列相同IRD变异且拥有眼部影像学数据的参与者。由三名评审员盲法评估其影像后,仅发现11人(16.1%)具有明确的、符合IRD的双侧异常表现,另有8人(11.8%)表现为不确定异常。因此,最大表型频率为27.9%,与AoU中基于EHR的估计值高度一致。在UKB中,PRPH2和RHO变异携带者中观察到影像学异常,而BEST1和RP1变异携带者则未发现异常,这与AoU中基于代码的富集模式相符。
针对可能存在的偏倚,研究人员进行了深入分析。首先,以表型谱广泛的CRX基因为例,发现其多数变异与包括莱伯先天性黑矇(LCA)在内的严重表型相关,排除了因表型轻微或晚发导致诊断不足的可能性。其次,逻辑回归分析表明,年龄、性别、吸烟史、社会经济地位(SES)或共病(如糖尿病)等因素均不能显著预测疾病注释状态。最后,将分析对象限定在60岁以上(IRD已充分表达的年龄)的参与者,发现IRD代码集的DAF并未显著升高(11.3% vs 9.4%),而视网膜病变集和筛查集的DAF虽有上升,但仍远低于100%。这进一步证实了低外显率的结论,而非诊断延迟或遗漏所致。
本研究通过两大独立生物样本库的数据,提供了令人信服的证据,表明IRD相关基因变异在普通人群中的外显率(9.4%-28.1%)远低于基于临床先证者研究的传统假设(近100%)。这一发现颠覆了对IRD作为高外显率孟德尔遗传病的简单认知。
研究结果支持一个新的疾病模型:IRD的发生并非由罕见的强效遗传变异单独决定,而是该变异与个体独特的遗传背景和环境因素相互作用的结果。只有当个体的整体“患病倾向”超过某个阈值时,疾病才会表现出来。这一模型同时解释了人群中广泛存在的不完全外显和同一个基因或变异导致的显著表型异质性(可变表达度)。
- 1.对临床实践的影响:研究提示,在无家族史的无症状个体中进行IRD基因筛查,其阳性预测值(PPV)可能很低(假阳性率高),需谨慎权衡其带来的潜在心理伤害和过度医疗风险。
- 2.对疾病机制探索的启示:低外显率意味着人群中携带IRD兼容基因型的个体比例(0.7%-2.1%)远高于实际患病率(约1/3,450),这为发现影响外显率和表达度的遗传或环境修饰因子提供了巨大的队列资源,有助于解释约30%-40%IRD病例中存在的“遗传缺失”问题。
- 3.对生物样本库研究的价值:本研究成功利用生物样本库数据再现了已知的基因型-表型关联(如PRPH2变异与AMD样表型、RHO变异与CME风险增加),证明了利用EHR进行大规模遗传病真实世界研究的可行性和可靠性。
总之,这项研究标志着我们对IRD遗传本质的理解迈出了关键一步,从简单的“一个基因,一种疾病”的确定性模型,转向了更复杂、更符合生物学现实的“基因-背景”互作模型。这不仅深化了基础科学认知,也为未来更精准的遗传咨询、风险评估和个体化治疗策略奠定了基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号