基于随机森林的 BRCA1 错义变异分类预测模型:评估错义突变影响的新方法

【字体: 时间:2025年04月19日 来源:Journal of Human Genetics 2.6

编辑推荐:

  在疾病的症状前检测和预防中,变异的准确分类至关重要。为解决现有工具对 BRCA1 变异分类准确性欠佳、缺乏解释的问题,研究人员开展了基于随机森林构建 BRCA1-Forest 模型的研究。结果显示,该模型在多数评估指标上优于现有工具,有助于精准评估 BRCA1 变异意义。

  准确分类变异是疾病症状前检测和预防的关键。由于 BRCA1 在乳腺癌和卵巢癌中发病率和外显率较高,高性能的预测工具可用于对其变异的临床意义进行分类。此前虽已开发出多种工具,但在特定病例中分类效果不佳,且通常只给出分数而无解释。为获得具有解释能力的精准预测工具,本研究提出 BRCA1-Forest 模型。该模型基于随机森林(一种著名的机器学习技术)构建,能在变异分类中做出具有高特异性和敏感性且可解释的决策。此方法通过逐步筛选选项直至得出最终决策。研究首先收集了一组 BRCA1 良性和致病性错义变异,然后根据每个变异对蛋白质序列的影响准备数据集,并添加理化变化和氨基酸位点保守评分作为致病性标准来丰富数据集。基于该数据集训练模型,以对变异的临床意义进行分类。将 BRCA1-Forest 的性能与四种前沿方法(SIFT、PolyPhen2、CADD 和 DANN),在精度、召回率、假阳性率(FPR)、受试者工作特征曲线下面积(AUC ROC)、精确召回曲线下面积(AUC-PR)和马修斯相关系数(MCC)等不同评估指标上进行比较。结果表明,除召回率外,该模型在所有指标上均优于上述工具。BRCA1-Forest 的软件可在https://github.com/HamedKAAC/BRCA1Forest获取。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号