编辑推荐:
乳腺癌严重威胁女性健康,精准预后和个性化治疗迫在眉睫。研究人员开展 “通过机器学习识别与泌乳相关的基因特征预测乳腺癌患者预后和治疗反应” 研究,构建出 LRS,发现其与 TME 及药物敏感性有关,为乳腺癌治疗提供新思路。
在当今医疗领域,乳腺癌就像一个隐藏在暗处的 “杀手”,时刻威胁着女性的健康。2022 年,全球约有 230 万新的乳腺癌病例被报道,这个庞大的数字令人触目惊心。尽管在早期检测和治疗策略方面取得了一定进展,可死亡率有所降低,但目前仍急需精准的预后生物标志物。因为只有精准判断患者的预后情况,才能为其量身定制个性化的治疗方案,从而有效提高患者的生存率和生活质量。在这样的背景下,来自山西大学体育学院和山西省肿瘤医院等机构的研究人员开启了一项意义非凡的研究,他们致力于探究泌乳(lactation)与乳腺癌患者预后之间的潜在联系,相关研究成果发表在了《Scientific Reports》上。
为了深入探究这一问题,研究人员运用了多种关键技术方法。首先,从多个数据库获取泌乳相关基因(LRGs)以及大量的基因表达和临床数据,这些数据来源广泛,为研究提供了坚实的基础。接着,通过一系列的生物信息学分析方法,如单因素 Cox 分析、无监督共识聚类分析、多种机器学习算法等筛选核心基因,构建相关模型。此外,还借助单细胞分析和空间转录组技术研究基因表达情况,利用实时荧光定量聚合酶链反应(RT-PCR)验证关键基因在临床组织中的表达,最后运用 CMap 分析和分子对接预测潜在的小分子化合物。
研究人员首先进行了泌乳相关亚型的鉴定。他们从 LRGs 与差异表达基因(DEGs)的交集基因入手,经过单因素 Cox 分析和 Kaplan-Meier 分析,得到 18 个具有预后意义的 LRGs。基于这些基因的表达谱,通过无监督共识聚类算法将乳腺癌样本分为 L1 和 L2 两个亚型。其中,L1 亚型患者预后较差,功能富集分析显示,该亚型主要与促进癌症发展的生物过程相关,如细胞周期、DNA 复制等;而 L2 亚型则与相对抑制癌症的生物过程相关,如细胞杀伤和免疫激活。
随后,研究人员利用机器学习筛选核心基因并构建了泌乳相关基因特征(LRS)。他们通过多种机器学习算法对不同亚型的差异表达基因进行分析,最终确定了 6 个核心基因(SHCBP1、SIM2、VGF、GABRQ、SUSD3 和 CLIC6)组成 LRS。通过比较不同机器学习算法构建的基因特征的 C 指数,选择 GBM 算法构建 LRS。结果显示,高 LRS 组的乳腺癌患者死亡率更高,预后更差,在多个队列中都验证了 LRS 对乳腺癌患者 1 年、3 年和 5 年总生存率具有良好的预测能力。
研究人员还分析了 LRS 与临床特征的关系。他们发现 LRS 在不同亚型、年龄、分期等临床特征中存在显著差异,且高 LRS 组在各个临床特征亚组中预后均较差。通过构建列线图(nomogram),进一步证明 LRS 是独立于其他临床特征的预后预测指标,该列线图能有效预测乳腺癌患者的预后情况。
在免疫细胞浸润分析方面,研究人员发现低 LRS 组的 ESTIMATE 评分和基质评分更高,免疫细胞浸润情况也与高 LRS 组不同。高 LRS 组中,具有抑制抗肿瘤免疫作用的 γδ T 细胞、II 型辅助性 T 细胞和调节性 T 细胞(Tregs)等免疫细胞浸润水平较高;而低 LRS 组中,自然杀伤细胞(NK cells)、初始 B 细胞等免疫细胞更为丰富。此外,不同 LRS 组在免疫抑制因子、免疫刺激因子、主要组织相容性复合体(MHC)分子、趋化因子及其受体的表达水平上也存在显著差异。
在探究不同 LRS 组的潜在机制时,研究人员发现高 LRS 组主要富集在细胞周期、组蛋白磷酸化等促进肿瘤发展的生物过程和信号通路中;低 LRS 组则主要富集在与铁离子反应、蛋白质自磷酸化的正调控等生物过程以及 β - 丙氨酸代谢、脂肪酸代谢等信号通路中。这表明高 LRS 组的肿瘤微环境更有利于肿瘤的发展和增殖。
在药物敏感性研究中,研究人员发现高 LRS 组对多西他赛、顺铂等化疗药物更为敏感,而低 LRS 组对细胞周期抑制剂(如瑞博西尼、帕博西尼等)更为敏感。这为乳腺癌患者的个性化治疗提供了重要的参考依据,有助于医生根据患者的 LRS 水平选择更合适的治疗药物。
通过单细胞和空间转录组分析,研究人员进一步探究了 LRS 中关键基因在不同细胞中的表达情况。结果显示,CLIC6、GABRQ、VGF 和 SIM2 主要在恶性细胞中富集,SHCBP1 在恶性细胞和单核 / 巨噬细胞中高表达,SUSD3 在恶性细胞、单核 / 巨噬细胞和 CD8Tex细胞中均有较高表达。并且,SUSD3、SHCBP1 和 SIM2 在恶性区域的表达高于正常区域。
最后,研究人员通过 RT-PCR 验证了 LRS 中关键基因在临床组织中的表达水平。结果表明,SHCBP1、SIM2、VGF、GABRQ 和 SUSD3 在癌组织中的表达上调,而 CLIC6 在癌组织中的表达下调。同时,通过 CMap 分析和分子对接,研究人员预测了针对高表达基因的潜在小分子化合物,如花生四烯酸三氟甲烷、AH - 6809、W - 13 和氯贝特等,为乳腺癌的靶向治疗提供了新的潜在药物选择。
在研究结论和讨论部分,研究人员构建的 LRS 可以有效评估乳腺癌患者的预后以及对药物的反应,预测的潜在基因抑制剂也为乳腺癌的靶向治疗提供了新的思路。然而,该研究也存在一定的局限性,比如主要依赖回顾性数据,缺乏对基因功能的验证,数据集之间可能存在批次效应等。尽管如此,这项研究依然具有重要意义。它揭示了泌乳相关基因特征与乳腺癌预后和治疗反应之间的关系,为乳腺癌的精准治疗提供了新的生物标志物和潜在的治疗靶点。未来,随着研究的不断深入,有望进一步完善相关研究,为乳腺癌患者带来更多的希望,推动乳腺癌治疗领域的发展。