《iScience》:Deciphering aging-associated prognosis and heterogeneity in gastric cancer through a machine learning-driven approach
编辑推荐:
胃癌(GC)死亡率高且治疗手段有限,缺乏精准预测模型。研究人员开展 “通过机器学习方法解析胃癌衰老相关预后及异质性” 的研究。他们构建衰老相关指数(AAI),识别两种分子亚型,揭示关键靶点和潜在药物。该研究为 GC 治疗提供新思路。
研究背景
在医学领域,胃癌(Gastric Cancer,GC)是一个极为棘手的难题。它是全球最致命的恶性肿瘤之一,在癌症相关死亡原因中位居第五 。仅在东亚地区,每年就有超过百万的新增病例。GC 的高死亡率令人担忧,这主要是因为其肿瘤进展迅速,临床表现多样,而且对现有治疗手段的反应有限。尽管内镜检测、胃切除术、化疗(CT)和放化疗(CRT)等干预措施已被应用,但患者的治疗效果依旧不佳,目前仍缺乏能够准确将 GC 患者分层为不同风险亚组的预测模型。因此,寻找新的治疗靶点、开发有效的风险分层模型,对改善患者的预后至关重要。
随着全球人口老龄化的加剧,衰老与癌症之间的关系受到越来越多的关注。衰老的多个特征,如基因组不稳定、端粒磨损、表观遗传改变等,都与癌症的发生发展密切相关。而且,衰老和癌症在基本机制上存在重叠,年龄相关的组织变化为肿瘤的进展提供了适宜的环境 。已有研究显示,GC 具有年龄相关的特征,患者的总生存期(Overall Survival,OS)与年龄呈负相关,不同年龄组之间存在显著的分子差异。然而,衰老与 GC 之间的关系尚未被充分探索,衰老相关模式在 GC 发病机制中的具体作用也有待深入研究。
为了解决这些问题,来自中山大学附属第七医院临床大数据研究中心等机构的研究人员开展了一项重要研究,相关成果发表在《iScience》杂志上。
研究方法
研究人员使用了多种关键技术方法。首先,从公共数据库收集数据,包括 TCGA-STAD 队列的 196 例 GC 肿瘤样本的多组学数据作为训练集,以及 GSE62254 和 GSE26899 队列作为验证集。通过对这些数据的分析,他们进行了一系列操作。利用 R 语言中的相关包,如 “survival”“glmnet” 等进行统计分析,构建并验证衰老相关特征;运用 “consensusClusterplus” 等包进行无监督聚类,发现和验证分子亚型;借助 “RTN”“RedeR” 等包构建调控网络并进行主调节因子分析;使用 ESTIMATE 和 MCPcounter 算法评估肿瘤浸润模式;从 CellMinerCDB 数据库获取药物活性数据进行药物敏感性分析。
研究结果
- 衰老相关特征在 GC 患者中的模式:研究人员分析了 445 个衰老相关基因,在 TCGA-STAD 训练集中,他们识别出 103 个差异表达的衰老相关特征基因,其中 92 个在 GC 肿瘤样本中上调,11 个下调 。功能注释表明,这些基因显著富集在 NF-κB 信号通路、细胞衰老和 DNA 损伤结合等生物学途径中。此外,遗传突变分析显示,约 90% 的 GC 样本存在变异突变,TP53 的突变率最高。
- 基于衰老相关特征构建预后风险模型:通过单变量 Cox 回归分析和 LASSO 回归模型,研究人员筛选出 20 个基因构建预后模型,并引入衰老相关指数(Aging-Associated Index,AAI) 。AAI 得分在肿瘤分期、淋巴结转移、肿瘤转移和生存状态等关键临床因素中存在显著差异。而且,AAI 是 GC 患者的独立预后指标,高 AAI 患者从辅助化疗中显著获益,但对免疫治疗更具抗性。
- AAI 在多数据集的预后价值验证:通过 Kaplan-Meier(KM)曲线分析,研究人员发现高 AAI 评分的 GC 患者生存率显著更低,在多个数据集(TCGA-STAD、GSE62254 和 GSE26899)中均得到验证 。在单细胞数据集(GSE163558)中,AAI 在巨噬细胞和单核细胞中高度富集,且与肿瘤转移状态相关,提示其可作为肿瘤进展和转移的预测工具。
- 两种分子亚型的鉴定:利用无监督聚类,研究人员识别出两种衰老相关的分子亚型 Cluster1 和 Cluster2 。Cluster2 患者的 OS 和无病生存期(Disease-Free Survival,DFS)明显更差。与其他亚型系统比较发现,Cluster2 肿瘤大多富集在间充质表型(Mesenchymal Phenotype,MP)、基因组稳定性(Genomic Stability,GS)和弥漫性簇中。
- 分子亚型的多组学特征:对两种分子亚型进行多组学分析发现,Cluster2 患者的 AAI 评分更高,年龄更年轻,且具有高甲基化和低体细胞拷贝数改变(Somatic Copy Number Alterations,SCNAs)的特征 。基因集富集分析(Gene Set Enrichment Analysis,GSEA)显示,Cluster2 中上皮 - 间质转化(Epithelial-Mesenchymal Transition,EMT)、VEGF、免疫相关途径和基质含量升高,而 Cluster1 中细胞周期相关特征基因显著上调。免疫浸润分析表明,Cluster2 的免疫细胞比例更高,免疫和基质评分更高,而 Cluster1 的肿瘤纯度更高。
- 亚型特异性调控网络的构建:构建亚型特异性调控网络,研究人员发现 ELK3 和 SOX7 是驱动 Cluster2 进展的关键转录因子(Transcription Factor,TF) 。高表达这两种 TF 的患者生存结局最差,且它们在 Cluster2 中显著上调。此外,基于 ELK3 和 SOX7 表达水平的 ROC 曲线显示出对 GC 分子亚型分类的高预测准确性。
- 药物敏感性分析:针对关键的主调节 TF 进行药物敏感性分析,研究发现 ELK3 表达可预测对多种 FDA 批准药物(如阿昔替尼、达卡巴嗪、克唑替尼和长春新碱)的敏感性 。这些药物的活性与 ELK3 和 SOX7 的表达水平密切相关,为 GC 的个性化治疗提供了潜在的药物选择。
研究结论与讨论
然而,该研究也存在一定的局限性。虽然 AAI 预后模型和 GC 分子亚型已在多个数据集中得到验证,但这仍是一项回顾性分析,需要在更大规模、多中心的前瞻性队列中进行验证,以确认其临床实用性。此外,基于已识别的主调节 TF 的药物敏感性预测,需要在 GC 细胞系模型中进行实验验证,以证实其治疗潜力。
尽管存在不足,但本研究为 GC 的治疗提供了新的视角和方向。通过深入了解衰老相关过程与 GC 肿瘤异质性之间的复杂联系,有望开发出更个性化、更有效的治疗策略,推动精准肿瘤学的发展,改善 GC 患者的预后。
濠电姷鏁搁崑鐐哄垂閸洖绠伴柟闂寸贰閺佸嫰鏌涢锝囪穿鐟滅増甯掗悙濠囨煃鐟欏嫬鍔ゅù婊堢畺閺岋綁鎮㈤悡搴濆枈濠碘剝褰冨﹢閬嶅焵椤掑喚娼愰柟绋挎憸閳ь剚绋堥弲婵嬪焵椤掑嫭娑ч柕鍫熸倐瀵偊宕掗悙鏉戔偓閿嬨亜閹哄秶鍔嶉柣锕€閰e铏规嫚閹绘帩鍔夌紓浣割儐鐢€崇暦濠靛绠虫俊銈傚亾缂佲偓婢舵劖鐓熼柡鍐ㄥ€哥敮鑸垫交濠靛洨绡€闁汇垽娼у瓭濠电偠灏欐繛鈧€规洘鍨块獮姗€骞囨担鐟板厞闁诲氦顫夊ú鏍洪妸鈺傚仼闁惧繐婀辩壕浠嬫煕鐏炲墽鎳呮い锔奸檮娣囧﹪顢曢敐鍥╃厜閻庤娲樺ú鐔笺€侀弮鍫濆窛妞ゆ牭绲剧粊顐︽⒒娴g懓顕滅紒璇插€块幃褔骞樺鍕枔閳ь剨缍嗛崰妤呮偂濞嗘劗绠鹃柤濂割杺閸ゆ瑦顨ラ悙杈捐€块柡灞炬礋瀹曞爼濡搁妷銉︽嚈闁诲孩顔栭崳顕€宕滈悢鑲╁祦鐎广儱顦介弫濠囨煟閿濆懏婀版繛鍫熸倐濮婄粯鎷呴挊澶夋睏闂佺儵鍓濆Λ鍐ㄧ暦瑜版帗鎯炴い鎰剁稻閻濈兘姊虹粔鍡楀濞堟洘銇勯妷銉уⅵ闁哄本鐩獮姗€鎳犻澶嬓滃┑鐐差嚟婵參宕归崼鏇炶摕闁哄洢鍨归獮銏′繆閵堝拑宸ラ柛鎾讳憾閺岋綁濮€閳轰胶浠繝銏㈡嚀濡宓勯梺鍦濠㈡﹢锝為崨瀛樼厽婵炲棗鑻禍鎯р攽閻愯尙婀撮柛濠冩礋濠€渚€姊洪幐搴g畵婵☆偅鐟х划鍫⑩偓锝庡枟閻撳啰鎲稿⿰鍫濈婵﹩鍘鹃埞宥夋煣韫囨凹娼愮€规洘鐓¢弻娑㈠箛閵婏附鐝栧銈傛櫇閸忔﹢寮婚妸銉㈡斀闁糕剝鐟ラ埅闈涒攽閳藉棗鐏犳い鎴濐樀瀵鈽夐姀鐘殿唺闂佺懓顕崕鎰涢敓鐘斥拺閻犲洤寮堕崬澶娾攽椤斿搫鈧鍒掑鑸电劶鐎广儱鎳愰ˇ銊ヮ渻閵堝棙灏靛┑顔惧厴椤㈡瑩骞掑Δ浣叉嫼闁荤姴娲犻埀顒冩珪閻忎線姊洪崨濠冪叆濡ょ姵鎮傞崺銏ゅ箻鐠囪尙顓洪梺鎸庢濡嫬鈻撻妷銉富闁靛牆妫涙晶顒傜磼椤旇偐鐒搁柛鈺傜洴瀵粙顢橀悢鍝勫箞婵犵數鍋涘Λ娆撳礉閺囥垺鍊堕柍鍝勫亞濞堜粙鏌i幇顒€绾ч柛鐘筹耿閺岀喖顢涘姣櫻呪偓娈垮櫘閸o絽鐣烽幒鎳虫梹鎷呯憴鍕絻
10x Genomics闂傚倸鍊风粈渚€骞栭锕€纾归柣鐔煎亰閻斿棙鎱ㄥ璇蹭壕濡ょ姷鍋為悧鐘诲灳閺傝¥鈧帗鍒婇悥鍓坢 HD 闂備浇顕х€涒晠顢欓弽顓炵獥闁圭儤顨呯壕濠氭煙閸撗呭笡闁绘挻娲橀幈銊ノ熼悡搴′粯闂佽绻掓慨鐑藉焵椤掑喚娼愭繛鍙夌矒瀹曚即骞橀懜娈挎綗闂佸湱鍎ら〃鍛寸嵁閵忊剝鍙忔慨妤€妫楁晶顔尖攽椤旂厧鏆f慨濠冩そ瀹曘劍绻濋崒婊呮噯婵犵妲呴崑鍛垝瀹ュ桅闁哄啫鐗嗙粻鐟懊归敐鍥ㄥ殌濞寸姰鍨藉娲箹閻愭彃濮夐梺鍝勬噺缁捇骞冩ィ鍐╃劶鐎广儱妫涢崢閬嶆椤愩垺鎼愭い鎴濇噺閹便劑鍩€椤掆偓閳规垿鎮欑€涙ḿ绋囧┑鈽嗗亝缁挻淇婇悽绋跨疀闁哄鐏濆畵鍡涙⒑缂佹ǘ缂氶柡浣规倐閹剝鎷呴搹鍦紳婵炶揪绲介幉鈥筹耿閻楀牅绻嗛柣鎰煐椤ュ鎽堕悙鐑樼厱鐟滃酣銆冮崨顖滅焼闁糕剝绋掗悡鏇㈡煃閳轰礁鏆堢紓鍌涘哺閺屽秷顧侀柛蹇旂〒閸掓帒鈻庨幘铏€悗骞垮劚椤︿即寮查幖浣圭叆闁绘洖鍊圭€氾拷
婵犵數濮烽弫鎼佸磻濞戞娑欐償閵娿儱鐎梺鍏肩ゴ閺呮粌鐣烽弻銉﹀€甸柨婵嗛娴滅偤鏌嶇紒妯活棃闁诡喗顨婇弫鎰償閳ュ磭顔戠紓鍌欐閼宠泛鈻嶆晶淇皊t闂傚倸鍊风欢姘缚瑜嶈灋婵°倕鎳忛弲婵嬫煥濠靛棙宸濈紒鐘虫煥椤潡鎳滈棃娑橆潓濠碘槅鍋呰摫闁靛洤瀚伴獮妯兼崉鏉炴壆鎹曠紓鍌氬€哥粔宕囨濮樿泛钃熸繛鎴欏灩閸愨偓闂侀潧臎閸愶絾瀚涘┑鐘垫暩閸嬫盯鎮ф繝鍥у偍妞ゃ儳顎怱PR缂傚倸鍊搁崐鐑芥倿閿斿墽鐭欓柟鐑橆殕閸庡孩銇勯弽顐粶闁绘帒鐏氶妵鍕箳閸℃ぞ澹曟俊鐐€х紓姘跺础閹惰棄绠栫憸鏂跨暦椤愶箑唯闁靛牆妫楁刊浼存⒒娓氣偓閳ь剛鍋涢懟顖涙櫠閺夋垟鏀介柍銉﹀墯閸ょ喖鏌嶈閸撱劎绱為崱娑樼婵ǹ娉涘Ч鏌ユ煃閸濆嫭鍣洪柛濠傜仛缁绘盯骞嬮悙鍨櫑婵犳鍠栭崯鎾蓟濞戙垹绫嶉柟鐐綑椤忥拷
闂傚倸鍊风粈渚€骞夐敓鐘偓鍐幢濡炴洖鎼オ浼村川椤撶偟浜伴梻濠庡亜濞诧妇绮欓幒妤€鍚归柛鏇ㄥ灡閻撶喖鏌熼柇锕€澧婚柛銈囧枛閺屾洟宕奸悢绋垮攭濡ょ姷鍋為悧鐘差嚕閸洖绠i柣妯活問閸炲爼姊绘担鍛婂暈闁荤喆鍎辫灋婵犻潧妫ḿ鏍р攽閻樺疇澹橀幆鐔兼⒑闂堟侗妾х紒鑼帶闇夐柣鎴eГ閻撶喖鏌eΟ澶稿惈闁告柨绉堕幉鎼佸级閸喗娈婚梺璇″枔閸庣敻寮幘缁樻櫢闁跨噦鎷� - 婵犵數濮烽弫鎼佸磿閹寸姴绶ら柦妯侯槺閺嗭附銇勯幒鎴濐仼闁活厽顨婇弻娑㈠焺閸愶紕绱板銈傛櫆閻擄繝寮诲☉銏犵労闁告劖鍎冲В鈧梻浣告贡閸庛倝骞愭ィ鍐︹偓鍛存倻閽樺顔愰柡澶婄墕婢х晫绮旈悽鍛婄厱閹兼番鍨归悘銉╂煃閽樺妯€妤犵偞锕㈤、娑橆潩椤愩埄妫滃┑鐘垫暩閸嬬偤宕归崼鏇炵闁冲搫鍊婚々鍙夌節婵犲倸鏆熼柡鍡畵閺岋綁寮崶顭戜哗缂佺偓鍎抽妶鎼佸蓟濞戙垹鐒洪柛鎰靛幖椤ユ繈姊洪崨濠冣拹閻㈩垽绻濋獮鍐ㄎ旈崨顓熷祶濡炪倖鎸鹃崑妯何i幇鐗堚拺缂備焦岣块埊鏇㈡煟閻旀繂娲ょ粻顖炴倵閿濆骸鏋涚紒鐘崇叀閺岀喐瀵肩€涙ɑ閿梺璇″枙缁舵艾顫忓ú顏勫窛濠电姴鍊婚鍌涚節閳封偓閸曞灚鐤侀悗娈垮枟婵炲﹪骞冮姀銈嗗亗閹艰揪缍嗛崬瑙勪繆閻愵亜鈧牠寮婚妸鈺傚€舵繝闈涚墢閻滅粯绻涢幋娆忕仾闁绘挻鐟╅幃褰掑Ω閵夘喗笑闂佺ǹ锕ら…鐑藉箖閻戣棄顫呴柕鍫濇閸樺崬鈹戦悙鍙夘棡闁挎岸鏌h箛瀣姕闁靛洤瀚伴、鏇㈠閳轰礁澹庨柣搴ゎ潐濞叉粍绻涢埀顒傗偓娈垮枙缁瑩銆侀弽顓ф晝闁挎繂鎳忕拠鐐烘倵濞堝灝鏋熼柟顔煎€垮顐﹀箻缂佹ɑ娅㈤梺璺ㄥ櫐閹凤拷
濠电姷鏁搁崑鐐哄垂閸洖绠伴柟闂寸贰閺佸嫰鏌涢锝囪穿鐟滅増甯掗悙濠冦亜閹哄棗浜鹃弶鈺傜箖缁绘繈鎮介棃娴躲垽鎮楀鐓庢珝闁诡垰鏈幆鏃堝Ω閿旀儳骞橀柣搴ゎ潐濞叉牕煤閵堝棛顩锋繝濠傜墛閻撴洟鏌i幇顒傛憼閻忓骏绠撻弻鐔兼寠婢跺ň鍋撴繝姘劦妞ゆ帒锕︾粔鐢告煕閹炬潙鍝烘い銏℃婵¤埖寰勭€n亙鍖栭梻浣筋潐婢瑰寮插☉娆庣箚闁惧繐婀辩壕濂告煏婵炑冨枤閺嗩參姊洪悷鏉挎Щ闁瑰啿閰i妶顏呭閺夋垹顦ㄩ梺闈浤涢埀顒勫磻閹惧绡€婵﹩鍘鹃崢鎼佹煟鎼搭垳绉甸柛瀣閹便劑宕奸妷锔惧幐閻庡厜鍋撻柍褜鍓熷畷鐗堟償閵娿儳鍘洪梺鍝勫暙閻楀棝宕¢幎鑺ョ厽婵☆垱瀵ч悵顏呮叏閿濆懎顏柡宀嬬稻閹棃濮€閳垛晛顫岄梻浣告啞濮婂湱鏁垾宕囨殾婵犻潧顑嗛崑鍕煟閹惧啿顔傞柕澶嗘櫆閻撱儵鏌i弴鐐测偓鍦偓姘炬嫹