将枢纽基因识别为宫颈癌潜在的诊断生物标志物:一种生物信息学方法

《Computational Biology and Chemistry》:Identification of hub genes as potential diagnostic biomarkers for cervical cancer: A bioinformatic approach

【字体: 时间:2025年08月08日 来源:Computational Biology and Chemistry 3.1

编辑推荐:

  宫颈癌生物标志物研究通过GEO数据库整合分析,利用GEO2R筛选出684个差异表达基因(446上调,238下调),结合PPI网络构建和GO/KEGG富集分析,鉴定出9个核心基因(CCNB2, AURKA等),经HPA蛋白表达验证及生存分析证实其与细胞周期调控和肿瘤发生通路密切相关,为早期诊断提供新靶点。

  
Tara Chand | Pankaj Vaishanavaa | Ashwini Kumar Dubey | Gauri Misra
印度政府卫生和家庭福利部国家生物研究所,A-32,Sector-62,Noida,Uttar Pradesh 201309,印度

摘要

背景

宫颈癌仍然是一种常见的恶性肿瘤,其发病率呈上升趋势,主要原因是性传播、持续的HPV感染以及筛查延迟。识别新的生物标志物对于改善宫颈癌的诊断、预后和治疗至关重要。本研究利用整合生物信息学方法,通过分析GEO数据库中的基因表达数据来寻找潜在的生物标志物。

方法

使用GEO2R分析了四个GEO微阵列数据集(GSE7410、GSE7803、GSE52903、GSE67522),以识别调整后的p值小于0.05的差异表达基因(DEGs)。使用Venn图可视化共同的DEGs。通过STRING构建蛋白质-蛋白质相互作用网络以识别枢纽基因。进行基因本体论(GO)和KEGG通路分析以研究生物学功能和通路。利用人类蛋白质图谱(HPA)通过免疫组化体外验证蛋白质表达。通过Kaplan-Meier生存分析来确定枢纽基因的预后价值。

结果

分析显示,在这些数据集中共有684个共同的DEGs(446个上调,238个下调)。从GSE67522中选取的前20个上调DEGs用于构建热图和PPI分析,从而识别出9个关键枢纽基因。GO和KEGG分析表明,其中6个基因显著参与细胞周期调控和肿瘤发生通路。这些枢纽基因通过HPA数据验证了其蛋白质表达。

结论

确定了6个枢纽基因(CCNB2、AURKA、CDC20、CDT1、CENPF和KIF2C)作为宫颈癌管理的潜在生物标志物。

影响

这些发现为了解在宫颈癌中起重要作用的基因的分子特征提供了宝贵的见解,有助于诊断的转化应用。

引言

2022年,印度报告了127,526例新发宫颈癌病例和79,906例死亡病例,这使其成为主要的公共卫生问题。全球范围内,宫颈癌导致662,044例新发病例和348,709例死亡病例(Ferlay等人,2024年)。全球每10万女性的发病率和死亡率分别为13.3和7.2(Singh等人,2023年)。宫颈癌的发展是一个复杂的生物学过程,由多种转录和遗传变化引发(Lin等人,2019年;Chand等人,2025年)。
人乳头瘤病毒(HPV)感染通常是宫颈癌的主要原因。大约70%的宫颈癌和癌前病变归因于HPV16和HPV18型(Wright,2009年)。尽管巴氏涂片(Pap)检测和HPV分子检测显著改善了发达国家的宫颈癌预后,但该疾病仍常常在晚期才被发现(Marx,1986年)。然而,由于许多HPV感染是暂时的且不太可能发展成癌症,当前的HPV检测在特异性和敏感性方面存在局限性,尤其是在资源匮乏的环境中(Hopman等人,2004年)。同样,虽然鳞状细胞癌(SCC)抗原等标志物用于预测SCC,但它们对于宫颈癌的诊断不够特异(Gaarenstroom等人,2000年)。早期宫颈癌通过化疗、放疗、手术或疫苗联合治疗具有较高的治愈率(外交部,2023a;世界卫生组织,2014年)。因此,识别新的生物标志物对于提高诊断的准确性和精确性至关重要,最终可以挽救生命并帮助癌症管理。
印度已采取大胆的国家举措,以符合全球消除宫颈癌的目标。印度政府致力于扩大HPV疫苗接种范围并引入本土疫苗。此外,人工智能技术也被用于加速宫颈癌筛查和早期检测(Devnath和Sharma,2024年)。尽管付出了这些努力,宫颈癌在印度女性中仍是最常见的癌症之一,这强调了加强诊断和预防措施的重要性(Ghosh等人,2024年)。
在此背景下,本研究旨在通过识别参与细胞周期调控和肿瘤发生通路的新的分子生物标志物,为国家和全球的努力做出贡献,以实现早期检测、提高诊断准确性并改善宫颈癌的临床管理。分析了四个基因表达数据集,以比较正常宫颈组织和宫颈癌样本之间的差异表达基因(DEGs)。构建了蛋白质-蛋白质相互作用(PPI)网络以定位枢纽基因,然后使用基因本体论(GO)和KEGG通路富集分析对其进行研究。这些枢纽基因的蛋白质表达水平通过人类蛋白质图谱(HPA)的免疫组化(IHC)数据体外进行了验证。此外,使用Kaplan-Meier分析评估了其预后相关性。
该研究的生物信息学工作流程如图1所示。

部分摘要

从GEO数据库收集数据

基因表达分析

经过仔细

关于宫颈癌的GEO数据集

共获得了109个数据集,其中只有14个与宫颈癌相关。根据样本大小、基因ID以及是否包含正常宫颈组织作为对照组,对这些14个数据集进行了进一步筛选(表1)。

正常宫颈组织和宫颈癌组织之间的DEGs分析

使用GEO2R网络工具进行了DEGs分析,利用默认设置比较GEO数据集内的样本组。GEO2R内部使用GEOquery和limma R包进行数据解析和差异表达分析,包括p值计算

讨论

宫颈癌继续构成重大的全球健康负担,促使了诸如世界卫生组织的全球战略等协调努力,以加速宫颈癌的根除(世界卫生组织,2020年),以及国际合作项目如Quad Cancer Moonshot Initiative,这些都在减少包括宫颈癌在内的癌症负担方面发挥了重要作用(外交部,2023a;外交部,2023b;新闻稿)

结论

本研究利用成熟的生物信息学工具确定了6个关键枢纽基因(CCNB2、AURKA、CDC20、CDT1、CENPF和KIF2C)作为宫颈癌的潜在诊断生物标志物,揭示这些基因主要参与致癌过程,包括细胞周期调控、基因组稳定性和肿瘤发生通路。体外验证通过蛋白质表达模式和生存分析进一步支持了它们的临床相关性。值得注意的是,这些基因的联合过表达

CRediT作者贡献声明

Pankaj Vaishanavaa:撰写——原始草稿、方法论、正式分析。Ashwini Kumar Dubey:撰写——审阅与编辑、撰写——原始草稿。Gauri Misra:撰写——审阅与编辑、监督、概念化。Tara Chand:撰写——原始草稿、方法论、正式分析。

出版同意

不适用

参与同意

不适用

伦理批准

不适用

资金

作者声明他们没有为这项工作获得任何特定资金。

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的财务利益或个人关系。

致谢

作者感谢Noida的NIB主任提供的基础设施支持。GM感谢ICMR的ICMRCAREP-2023-0000517项目资助。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号