-
生物通官微
陪你抓住生命科技
跳动的脉搏
Cell:首次建立串联重复扩增的大规模遗传图谱
【字体: 大 中 小 】 时间:2024年04月08日 来源:news-medical
编辑推荐:
加州大学欧文分校领导的研究团队近日首次建立了串联重复扩增的遗传参照图谱(TR-gnomAD)。这些数据可以帮助研究人员探索突变与疾病之间的关系,更好地了解健康差异并改进临床诊断。
人类基因组中存在着大量的串联重复(TR)序列。这些重复的DNA短片段与50多种致命的人类疾病有关,包括肌萎缩性侧索硬化症(ALS)、亨廷顿病和多种癌症。目前,全基因组测序捕获的串联重复扩增已被广泛用于罕见病的诊断。
基因组聚合数据库(gnomAD)被认为是人类遗传变异的金标准参照图谱,也是解读疾病关联研究中发现的单核苷酸变异和结构变异的重要工具,却在很大程度上忽略了串联重复扩增。这种忽略意味着我们对生物样本库规模的串联重复扩增还了解不多。
加州大学欧文分校领导的研究团队近日首次建立了串联重复扩增的遗传参照图谱(TR-gnomAD)。这些数据可以帮助研究人员探索突变与疾病之间的关系,更好地了解健康差异并改进临床诊断。
这篇题为“A genome-wide spectrum of tandem repeat expansions in 338,963 humans”的论文于4月5日发表在《Cell》杂志上。
共同通讯作者、加州大学欧文分校的生物信息学教授Wei Li表示:“TR-gnomAD让我们能够根据这些突变在不同血统中的变化情况来确定某些疾病如何影响不同的人群。然后,遗传咨询公司就可以开发产品来解读这些信息,并准确报告某些性状如何与不同人群和疾病相关联。”
为了构建这个数据库,研究团队分析了338,963名参与者的基因组数据,这些基因组代表了不同的血统(39.5%为非欧洲裔),WGS数据的平均覆盖度为33倍。他们使用了两种准确且广泛使用的软件工具:ExpansionHunter和GangSTR。
利用这种策略,他们能够对每名个体的91万个串联重复进行基因分型。在利用TRTools去除低质量的串联重复等位基因后,他们保留了86万个串联重复用于进一步分析。他们还发现,30.5%的串联重复至少有两种常见等位基因(频率≥ 0.05)。
此外,研究人员认为,TR-gnomAD有助于区分常见的(也许是良性的)串联重复扩增和潜在致病的串联重复扩增,前者在TR-gnomAD中普遍存在,而后者在患病群体中频繁出现。
总的来说,TR-gnomAD是一种宝贵资源,可帮助研究人员和医生解释遗传病患者的串联重复扩增。展望未来,研究人员计划分析更多来自不同背景的全基因组测序数据,重点关注代表性不足的血统。
“尽管我们成功地对大量串联重复进行了基因分型,但这仍然只占人类基因组总数的一小部分,”Li谈道。“下一步我们将优先整合更多高质量的串联重复,并纳入代表性不足的血统。”