贝叶斯网络模型揭示早期胃癌发病影响因素,助力高风险人群精准防控

【字体: 时间:2025年03月22日 来源:BMC Gastroenterology 2.5

编辑推荐:

  研究人员构建贝叶斯网络(BN)模型分析早期胃癌发病因素,为防控提供支持。

  胃癌,作为全球范围内常见的恶性肿瘤之一,严重威胁着人类的健康。在中国,胃癌的发病率和死亡率也一直居高不下,尽管近年来这两项数据呈现出一定的下降趋势,但整体负担依然沉重。早期胃癌患者的五年生存率可高达 85%,然而,由于早期症状不明显,大部分患者确诊时已处于晚期,此时即便积极治疗,五年生存率也会骤降至 10% 以下。目前,内镜检查结合病理组织活检虽被视为早期胃癌筛查的 “金标准”,但高昂的成本、对设备和医生专业水平的依赖,以及内镜检查带来的不适感,使得该方法在农村和医疗资源有限地区难以广泛推广,也导致无症状患者的接受度较低。因此,深入探究早期胃癌发病的影响因素,构建有效的风险模型,对早期干预策略的制定至关重要。
为了解决这一难题,昆明医科大学和临沧市人民医院的研究人员展开了一项极具意义的研究。他们运用机器学习中的 Lasso 回归、滑动窗口顺序前向选择法(SWSFS)以及贝叶斯网络(BN)模型等技术,对早期胃癌的发病风险进行评估和预测,相关研究成果发表在《BMC Gastroenterology》杂志上。

在研究方法上,研究人员于 2022 - 2023 年在临沧市人民医院开展了一项横断面研究。他们依据《胃癌筛查与早诊早治方案(2024 版)》,对 1820 名胃癌高风险个体进行了疾病筛查和问卷调查。这些个体被分为胃癌组()和非胃癌组(),通过胃镜检查结果判断是否患有胃癌 。研究人员首先使用 R 4.3.3 及其安装包和 Netical 软件进行统计分析,利用 “glment” 和 “randomForest” 包进行 Lasso 回归和 SWSFS,筛选出对胃癌有显著影响的变量。然后,将数据按照 70% 训练集、30% 测试集的比例划分,在训练集中运用筛选出的变量,借助 “bnlearn” 包和爬山算法(hc)构建 BN 模型,并进行参数学习。最后,通过准确率、灵敏度、特异性等指标评估模型性能。

在研究结果方面,研究人员首先对参与者的特征进行了分析。在 1820 名参与者中,男性 743 人(40.82%),女性 1077 人(59.18%),平均年龄为 56.22 ± 7.64 岁。经统计,共发现 129 例胃癌患者,占总人数的 7.09%。不同性别间胃癌检出率无显著差异,但不同民族和现居地址的人群中,胃癌检出率存在显著差异。汉族、佤族和彝族的胃癌检出率较高,均超过 8.00%;临沧北部地区的凤庆县和永德县,胃癌发病率相对较高。此外,饮酒、有上消化道症状(如反酸、恶心、呕吐)、患有严重胃肠道症状(SGIM)、无胃炎病史以及有上消化道癌症家族史的人群,更易检测出胃癌。

通过 Lasso 回归和 SWSFS 进行风险因素筛选,Lasso 回归确定了 9 个临床相关指标,包括民族、现居地址、部分上消化道症状、饮酒、SGIM、胃炎和家族史等。SWSFS 则显示,当变量数设为 10 时,袋外误差最小,按重要性排序,前十个变量分别为民族、现居地址、胃息肉、缺牙情况、腹胀、年龄、上腹痛、性别、进食过快和反酸。

在构建和评估早期胃癌的 BN 模型时,研究人员将研究对象的人口统计学特征与筛选出的变量相结合构建 BN 模型。结果显示,基于 Lasso 筛选变量和人口统计学特征构建的模型表现更优,其 AUC 为 0.637,准确率为 0.916,特异性为 0.974,灵敏度为 0.132,阳性预测值为 0.278,阴性预测值为 0.937 。该模型包含 13 个节点和 18 条边,分析表明饮酒、吸烟、年龄、家族史、SGIM、呕吐、恶心、反酸和胃炎等与胃癌发生直接相关;现居地址、性别和民族则通过影响饮酒和吸烟间接与胃癌相关;家族史还可通过 SGIM 间接影响胃癌发展,SGIM 和胃炎可通过相应症状提示胃癌的存在。利用构建的网络模型进行推理,当患者有饮酒和吸烟史但无其他疾病症状时,患胃癌的可能性增加到 16.7%;若患者被诊断为 SGIM 且有恶心、反酸症状,患胃癌风险则升至 53.6%。

在研究结论与讨论部分,本研究通过 Lasso 和 SWSFS 进行变量选择,解决了变量间的共线性问题,成功构建了最优的 BN 模型。该模型直观展示了影响早期胃癌发病因素之间的直接和间接关系,明确了其内在调控机制,克服了传统预测模型在解释因果关系和概率计算方面的局限,有助于医疗人员早期识别胃癌高风险人群,提高早期诊断和治疗水平,及时进行针对性干预,降低胃癌发病风险,减少患者生活质量的损失。但研究也存在一定局限性,如研究为横断面研究,无法确定因果关系;样本仅来自单一机构,普适性受限;仅使用了 BN 模型,模型预测性能还有待提升。未来研究可扩大样本范围,采用多种模型进行综合分析,进一步深入探究各因素与胃癌发病的关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号