在人工智能深度学习的帮助下,165个新的癌症基因被识别

【字体: 时间:2021年04月13日 来源:Nature Machine Intelligence

编辑推荐:

  在人工智能深度学习的帮助下,165个新的癌症基因被识别。EMOGI程序并不局限于癌症。马斯科解释说,理论上,它可以用来整合不同的生物数据集,并从中找到模式。

  

 

   

IMAGE

图片:借助数据分析的力量“看穿”癌症——这可能在人工智能的帮助下实现。

资料来源:MPI f.分子遗传学/ Ella Maru工作室

一种新的算法可以预测哪些基因导致癌症,即使它们的DNA序列没有改变。柏林的一组研究人员结合了各种各样的数据,用“人工智能”分析了这些数据,并识别出了许多癌症基因。这为个性化医学中的靶向癌症治疗和生物标记物的开发开辟了新的前景。

在癌症中,细胞会失去控制。它们增殖并进入组织,破坏器官,从而损害重要的生命功能。这种不受限制的生长通常是由癌症基因中DNA变化的积累引起的,即这些控制细胞发育的基因的突变。但有些癌症只有很少的突变基因,这意味着在这些病例中,其他原因导致疾病。

柏林马克斯·普朗克分子遗传学研究所(MPIMG)和Helmholtz Zentrum计算生物学研究所München的研究人员开发了一种新的算法,使用机器学习技术识别165种以前未知的癌症基因。这些基因的序列不一定改变——显然,这些基因的失调已经可能导致癌症。所有这些新发现的基因都与已知的癌症基因密切相关,并在细胞培养实验中被证明对肿瘤细胞的生存至关重要。

个性化医疗的额外目标

该算法被称为“EMOGI”,用于解释多组图集成,也可以解释细胞机制中使基因成为癌症基因的关系。正如安娜丽莎·马sico领导的研究团队在《自然机器智能》杂志上所描述的那样,该软件整合了数万个从患者样本中生成的数据集。这些信息包括DNA甲基化、单个基因的活性和细胞路径内蛋白质的相互作用,以及突变序列数据。在这些数据中,一种深度学习算法检测导致癌症发展的模式和分子原理。

“理想情况下,我们可以在某一时刻获得所有癌症基因的完整图像,这对不同患者的癌症进展有不同的影响,”马sico说,他是MPIMG研究小组的负责人,直到最近,现在在Helmholtz Zentrum München工作。这是个性化癌症治疗的基础。”

与化疗等传统癌症治疗不同,个性化治疗方法精确地根据肿瘤类型调整药物。“我们的目标是为每个病人选择最好的治疗方法,也就是说,用副作用最少的最有效的治疗方法。此外,我们将能够根据癌症的分子特征识别早期癌症。”

“只有我们知道这种疾病的原因,我们才能有效地对抗或纠正它们,”研究人员说。“这就是为什么找出尽可能多的诱发癌症的机制是如此重要。”

结合使用效果更好

“到目前为止,大多数研究都集中在基因序列的致病变化上,也就是细胞蓝图上,”马斯科团队的博士生罗曼·舒尔特-萨瑟(Roman Schulte-Sasse)说,他也是该论文的第一作者。“与此同时,近年来,表观遗传扰动或基因活动失调也可能导致癌症,这一点变得越来越明显。”

这就是为什么研究人员将反映蓝图错误的序列数据与代表细胞内事件的信息合并。最初,科学家们证实了突变,即基因组片段的扩增,确实是癌症的主要驱动因素。然后,在第二步中,他们找到了与实际癌症驱动基因不那么直接的候选基因。

舒尔特-萨斯说:“例如,我们发现一些基因,它们的序列在癌症中基本没有变化,但对肿瘤来说却是不可或缺的,因为它们调节能量供应。”这些基因是通过其他方式失去控制的,例如由于DNA上的化学变化,如甲基化。这些修饰保留了序列信息,但控制了基因的活动。“这些基因是很有希望的药物靶点,但因为它们是在后台运作的,我们只能通过复杂的算法来找到它们。”

为进一步研究寻找线索

研究人员的新项目为疑似癌症基因列表增加了相当多的新条目,近年来该列表已增加到700至1000个。只有通过生物信息分析和最新的人工智能(AI)方法的结合,研究人员才能追踪到隐藏的基因。

“蛋白质和基因之间的相互作用可以被绘制成一个数学网络,称为图谱,”舒尔特-萨斯说。“你可以把它想象成试图猜测一个铁路网;每个车站都对应着一个蛋白质或基因,它们之间的每一个相互作用就是火车连接。”

在深度学习的帮助下——正是这种算法近年来帮助人工智能取得了突破——研究人员甚至能够发现那些以前被忽视的列车连接。舒尔特-萨斯让计算机分析了来自16种不同癌症类型的数万张不同的网络图,每一种都包含1.2万到1.9万个数据点。

也适用于其他类型的疾病

数据中隐藏着更多有趣的细节。马斯科说:“我们看到的模式取决于特定的癌症和组织。”“我们认为这是肿瘤是由不同器官的不同分子机制引发的证据。”

研究人员强调,EMOGI程序并不局限于癌症。马斯科解释说,理论上,它可以用来整合不同的生物数据集,并从中找到模式。“将我们的算法应用于类似的复杂疾病可能会很有用,这些疾病需要收集多方面的数据,而基因在其中发挥着重要作用。”一个例子可能是复杂的代谢疾病,如糖尿病。”

# # #

最初的发布

人工智能将多组学数据与图形卷积网络整合,以识别新的癌症基因及其相关的分子机制。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:癌基因|

  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号