-
生物通官微
陪你抓住生命科技
跳动的脉搏
新工具解开自闭症相关基因的下游影响
bioRxiv:Causal differential expression analysis under unmeasured confounders with causarray
【字体: 大 中 小 】 时间:2025年03月31日 来源:bioRxiv
一种新开发的统计工具为研究自闭症相关变异的下游效应提供了一种控制未测量混杂因素的方法。研究人员在上个月发布于bioRxiv的预印本中描述了这一名为causarray的工具。
现有的统计方法可以帮助确定哪些变异或遗传变化与基因表达的改变相关,但无法确定这些联系是否具有因果关系,卡内基梅隆大学统计学与生命科学教授、该研究的主要研究者Kathryn Roeder表示。
例如,已发现超过100个与自闭症相关的基因,但每个基因可能只影响一小部分患者。“该领域的一个主要问题是,如此多的不同基因是如何在生物学上汇聚在一起的,”宾夕法尼亚大学精神病学、遗传学和儿科学副教授Michael Gandal说,他并未参与该工具的开发。
先进的技术,如Perturb-seq(结合基因编辑与单细胞RNA测序),使科学家能够在单个细胞中改变与自闭症或其他脑部疾病相关的基因,并观察发育中的小鼠大脑中基因表达的相应变化。随着这些方法的发展,拥有能够区分遗传变化的直接影响与由其他因素引起的间接影响(这些影响往往难以察觉)的统计工具变得至关重要,Gandal说:“通过明确建模未测量的混杂因素,causarray将考虑这些潜在偏差,增强估计因果效应的稳健性。”
当科学家将一个遗传变异引入细胞并与对照细胞比较基因表达时,除了变异本身之外,许多因素——包括实验之间的差异以及细胞自身的变异——都可能影响基因表达。“他们敲低的每一个自闭症基因都有大量下游基因发生了显著变化——我们认为这是以因果方式发生的。”Kathryn Roeder说。
大多数用于控制数据中潜在混杂因素的工具会调整实验室条件或样本来源的动物或人类的年龄和性别等因素,但这些技术无法处理无法直接测量的影响,Roeder说。
Causarray帮助科学家考虑未测量的混杂因素。该工具结合机器学习和统计技术对基因表达进行建模,并估计如果关键因素(如治疗或遗传变化)有所不同,将会发生什么——这种方法被称为反事实。通过将反事实结果与实际结果进行比较,causarray可以分离遗传变异对基因表达的直接影响。
研究人员发现,causarray的表现优于不使用反事实方法的现有方法。例如,与另一种校正基因表达数据中隐藏偏差的方法相比,它产生的假阳性结果少了一半,这意味着它更善于识别真正显著的遗传变化,而不是随机噪声。在用于分析Perturb-seq数据时,causarray识别出自闭症相关基因变异与下游效应之间的关系,这些关系更准确地反映了自闭症相关基因扰动的预期因果效应,例如SATB2在神经元发育和突触结构中的作用。
Roeder补充说,其他方法将自闭症相关变异与核糖体功能等过程联系起来。尽管过去的研究已将核糖体活性与自闭症联系起来,但这些变化可能是由影响突触的基因中断引发的连锁效应。
“我对我们的分析感到非常满意,”Roeder谈到这次实验时说,“他们敲低的每一个自闭症基因都有大量下游基因发生了显著变化——我们认为这是以因果方式发生的。”
当用于分析阿尔茨海默病数据时,causarray揭示出与该疾病相关的某些基因比其他基因更受衰老的影响——这一发现可能有助于科学家识别新的治疗靶点,预印本建议。
causarray工具类似于匹配方法,后者比较有无治疗的相似细胞,但它通过估计对基因表达的隐藏影响而走得更远,加州大学洛杉矶分校统计学教授Jingyi Jessica Li说,她并未参与该研究。
Gandal说,causarray提供了一种更准确的方法来识别自闭症中涉及的特定遗传变化的直接影响。但他补充说,有时混杂因素与感兴趣的变量(如遗传操作)相关联,这使得识别真正的因果关系变得困难。
哈佛医学院生物医学科学与遗传学教授Steven McCarroll说,Roeder的最新工作“严谨且富有创造性”,他并未参与causarray的开发。他还表示,这项研究也提醒人们,通过以新的方式重新分析数据集可以学到多少东西。“我预计[causarray]将对研究大脑疾病生物学基础的研究产生重大影响。”
知名企业招聘
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号