-
生物通官微
陪你抓住生命科技
跳动的脉搏
人工智能模型利用基因测序数据预测癌症的主要来源
【字体: 大 中 小 】 时间:2023年08月08日 来源:AAAS
编辑推荐:
丹娜-法伯癌症研究所的研究人员创造了一种基于人工智能的工具,该工具使用肿瘤基因测序数据来预测患者癌症的主要来源。这项发表在《自然医学》杂志上的研究表明,这种名为OncoNPC的预测工具可以帮助指导癌症的治疗,并改善难以诊断病例的结果
丹娜-法伯癌症研究所的研究人员创造了一种基于人工智能的工具,该工具使用肿瘤基因测序数据来预测患者癌症的主要来源。这项发表在《自然医学》杂志上的研究表明,这种名为OncoNPC的预测工具可以帮助指导癌症的治疗,并改善难以诊断病例的结果。
传统上,癌症的主要来源是通过标准化的诊断检查来诊断的,包括基于肿瘤活检细胞切片的放射学和病理学评估。在3-5%的癌症病例中,肿瘤的原始来源无法确定。
在这些病例中,患者被诊断为原发性未知癌症(CUP),并且几乎没有治疗选择,因为大多数治疗方法都是针对特定类型的癌症批准的。
Dana-Farber研究员和资深作者Alexander Gusev博士说:“这个患者群体的结果很糟糕。”
研究小组发现,人工智能模型的预测可能对这些患者有价值。一项回顾性分析表明,这一额外的关于肿瘤主要来源的诊断信息可以帮助医生选择提高生存率的治疗方法。
Gusev说:“我们认为OncoNPC的预测是一种推动,一种为癌症提供可能解释的方式,有助于指出适当的治疗,包括精准医疗。”
为了建立模型,研究人员使用来自三个主要癌症中心(包括Dana-Farber)的36,445名已知原发肿瘤患者的医疗记录,训练并验证了一个机器学习分类器。记录中包含每位患者的肿瘤基因测序数据和临床信息。
Gusev和第一作者Intae Moon是麻省理工学院的研究生,也是Gusev实验室的研究员,他们选择使用可解释的机器学习模型,这意味着模型预测背后的推理比其他形式的人工智能更透明。
“我们认为这种透明度将有助于临床医生信任该模型,了解遗传因素对模型预测的影响,特别是考虑到CUP肿瘤的神秘性质,在临床和生物学上也可能是有用的。”
OncoNPC是肿瘤学NGS-based Primary cancer type Classifier的缩写,使用未用作训练数据的病例子集,准确预测了大约80%的已知类型肿瘤的起源,包括转移性肿瘤。该模型对65%的肿瘤进行了高置信度预测,这意味着它评估其预测的正确概率很高。这些预测的准确率为95%。
然后,他们将OncoNPC应用到一个独立的数据库中,该数据库中有来自丹娜-法伯医院的971例CUP肿瘤患者,那里的一组专家已经做出了大量的努力来确定肿瘤的主要来源。在971例病例中,OncoNPC能够以高置信度预测400例(41.2%)肿瘤的起源。
为了验证这些预测,研究小组研究了这些患者的遗传生殖系癌症风险,发现风险与预测相符。此外,他们还仔细研究了具体病例,以确定包括病理结果、患者病史和基因突变在内的数据是否支持这一预测。
“验证是一个挑战,因为没有确凿的事实。现有的方法无法确定其起源,”Gusev说。“但我们看到的证据表明,这个模型是在正确的轨道上。”
为了确定OncoNPC预测是否对患者有价值,研究小组检查了一部分CUP患者的结果。接受与预测的原发肿瘤部位相匹配的治疗的患者比接受与预测不匹配的治疗的患者生存时间更长。此外,他们发现OncoNPC预测将使大约2.2倍的CUP患者与批准的靶向药物相匹配。
Gusev说:“这可能为这些患者提供更精确的治疗。”
迄今为止,该工具仅使用回顾性数据进行了研究。为了确定它是否能改善患者的预后,还需要在临床试验中进行测试。
Gusev和Moon计划在OncoNPC的基础上,扩展用于预测的数据,包括额外的诊断信息,如病理结果。
此外,他们希望与社区癌症中心合作,了解更多关于OncoNPC预测如何补充现有诊断的信息。在较小的癌症中心,CUP病例可能更常见,因为它们有较少的病理学家可以投入到困难的诊断中。
Gusev说:“这种方法的吸引力在于,肿瘤小组是广泛可用的,并且很容易通过算法运行这些结果来进行预测。”“在资源有限的情况下,这可能很有价值。”
Machine Learning for Genetics-based Classification and Treatment Response Prediction in Cancer of Unknown Primary