编辑推荐:
这篇研究利用 12 只健康雄性橄榄狒狒的 11 种组织样本进行全基因组等位基因特异性表达(ASE)分析。研究发现狒狒基因组杂合度高,超 63% 的蛋白编码基因至少在一个样本中表现出 ASE,还鉴定出与人类共有的 ASE 变异,为探究人类疾病遗传机制提供关键线索。
### 研究背景
随着人类遗传学的发展,全基因组关联研究(GWASs)虽然在绘制与复杂疾病风险相关的变异方面取得进展,但确定个体因果疾病变异仍面临诸多挑战。基因表达存在组织特异性,且同一基因的两个等位基因在不同组织中常出现表达不平衡,即等位基因特异性表达(ASE)。ASE 受多种因素影响,与多种疾病和生物过程相关,深入研究其在不同组织中的情况,对理解基因型 - 表型相关性和人类基因组功能至关重要。由于获取健康人类合适组织样本存在困难,非人类灵长类动物如狒狒,因其与人类基因组相似度高且杂合度高,成为研究 ASE 的理想模型。
研究方法
- 样本采集与处理:研究使用了 12 只年龄在 5 - 6 岁、体重 7 - 11kg 的雄性橄榄狒狒(Papio anubis)的 11 种不同组织样本,包括大脑、心脏、肺等。这些狒狒经过筛选确保无传染病,在受控条件下饲养 1 个月后采集样本。样本采集后迅速冷冻保存。
- 测序与数据分析:对 12 只狒狒的基因组 DNA 进行测序,采用 Illumina Nova - Seq 方法和牛津纳米孔技术(ONT)长读长测序技术,分别达到至少 30× 和 15× 的测序深度。对 11 种组织类型的 RNA 进行提取,合成互补 DNA(cDNA)后测序,深度中位数为 2500 万 Illumina 读对。利用多种软件和工具进行变异检测、注释、单倍型分型等分析,使用 MBASED 和 β - 二项式检验来检测 ASE。
研究结果
- 狒狒基因组杂合度高:研究在狒狒 20 条常染色体上鉴定出 1570 万个单核苷酸变异(SNV),平均每个狒狒基因组有 480 万个常染色体杂合 SNV,其杂合度几乎是人类的两倍。这不仅扩大了适合 ASE 分析的基因集,还增强了 ASE 检测的可靠性。在转录区域,狒狒外显子区域的杂合度几乎是人类的三倍,88% 的注释基因集适合进行 ASE 分析。
- ASE 分析结果:研究对 15239 个基因进行 ASE 分析,涵盖了 72% 的注释蛋白编码基因集。发现 63% 的注释基因在至少一个样本中表现出 ASE,这一比例与人类 GTEx 数据集相比略高。研究还发现,基因表达水平与 ASE 存在关联,高表达基因更易表现出 ASE。同时,研究识别出一些在特定组织中表现出 ASE 的基因,如ZNF385B在肾脏皮质中表现出 ASE,OLFM4在回肠中表现出 ASE,且不同个体间存在单倍型切换现象。
- ASE 基因的表达模式:超过 68% 的表现出 ASE 的蛋白编码基因在所有样本中持续双等位基因表达,且双等位基因表达的基因往往在不同组织中保持相同的表达模式。研究还鉴定出 277 个单等位基因表达的 ASE 基因,其中 14 个在其他物种中有已知的印记行为,如MEST基因在多个组织中始终表达相同单倍型。
- ASE 变异的功能影响:研究中超过 60% 的 ASE 变异位于非翻译区(UTRs),其余为同义或错义变异。许多高影响变异导致基因在多个样本中表现出 ASE,表明这些变异对基因表达有重要影响。通过 PrimateAI - 3D 和 AlphaMissense 评估,发现部分错义变异可能具有致病性,且致病等位基因更倾向于低表达。
研究讨论
- 研究意义:该研究利用狒狒模型对 ASE 进行分析,为理解健康个体的 ASE 提供了更全面的视角。由于狒狒基因组杂合度高,其 ASE 研究结果比基于人类低杂合度数据集的估计更可靠。研究有助于构建全面的 ASE 目录,推动对 ASE 在疾病风险中作用的研究,以及识别致病变异。
- 研究发现:研究发现 ASE 在不同组织和基因中的分布不均,基因表达水平与 ASE 密切相关,且存在组织特异性的单倍型切换现象。这些发现与人类和其他哺乳动物的研究结果相似,表明 ASE 调控机制在进化上具有一定的保守性。
- 研究局限:研究存在一些局限性,如测序深度可能导致低表达基因被排除在 ASE 分析之外,参考等位基因映射偏差和过分散可能影响结果的准确性,样本量较小限制了对 ASE 因果关系的研究。未来研究需要更大的样本量和更先进的技术来解决这些问题。