scMalignantFinder:基于癌症特征的单细胞与空间转录组恶性细胞智能识别新工具

《Communications Biology》:scMalignantFinder distinguishes malignant cells in single-cell and spatial transcriptomics by leveraging cancer signatures

【字体: 时间:2025年03月28日 来源:Communications Biology 5.2

编辑推荐:

  单细胞RNA测序(scRNA-seq)为解析肿瘤异质性提供了强大工具,但恶性细胞的精准鉴定仍是重大挑战。中国科学院研究人员开发了机器学习工具scMalignantFinder,通过整合9个泛癌特征基因集校准的40余万细胞训练数据,采用差异表达基因(DEGs)联合策略构建分类模型。该工具在13个测试数据集上平均准确率达0.824,显著优于现有方法,并能追踪癌变动态过程及识别空间转录组(ST)恶性区域。相关成果发表于《Communications Biology》,为肿瘤研究提供了高效可靠的恶性细胞鉴定新范式。

  

肿瘤就像一座复杂的"细胞城市",其中恶性细胞如同伪装的特工,混迹在正常细胞中难以辨别。虽然单细胞RNA测序(scRNA-seq)技术让我们能够"监听"每个细胞的基因表达"对话",但如何准确识别这些"特工"仍是肿瘤研究领域的重大挑战。现有方法如CNV(拷贝数变异)推断依赖基因组结构变异,而SNV(单核苷酸变异)检测又受限于测序技术,更棘手的是肿瘤存在巨大的转录组异质性——就像特工们使用不同的"暗号",使得基于单一特征的识别方法频频失误。

中国科学院的研究团队在《Communications Biology》发表了突破性研究,他们开发的scMalignantFinder工具创新性地采用"数据驱动+知识引导"双轨策略。通过整合5个癌种40余万细胞的scRNA-seq数据,用9个经TCGA验证的泛癌特征基因集校准训练集,最终构建出基于2707个DEGs的机器学习模型。这个"智能侦探"不仅能准确识别单细胞数据中的恶性上皮细胞,还能追踪癌变动态过程,甚至在空间转录组(ST)数据中定位恶性区域。

关键技术方法包括:1)收集5个癌种(scRNA-seq)数据集和TCGA泛癌数据构建训练集;2)采用9个癌症特征基因集(8个上调1个下调)校准恶性细胞标签;3)联合各数据集DEGs(1656上调和1051下调)构建逻辑回归模型;4)在13个测试集(含198个癌细胞系和11个患者数据集)进行验证;5)整合恶性概率、特征活性和病理图像评分进行ST数据分析。

"性能验证"部分显示,scMalignantFinder在癌细胞系测试中灵敏度达1.000,特异性0.786,显著优于PreCanCell等现有工具。在11个患者数据集上平均平衡准确率0.732,其中6个癌种表现最佳。值得注意的是,被模型"误判"的细胞实际上表现出与恶性细胞相似的CNV模式和特征基因活性,暗示这些可能是处于转化过渡态的细胞。

"癌变过程解析"应用证实,该工具能捕捉结直肠癌从正常黏膜→息肉→肿瘤的恶性细胞比例递增趋势(0%→显著增加→峰值),在胃癌进展(NAG→CAG→IM→EGC)中也呈现类似规律。特征分析发现,跨癌种保守的DEGs(占28%)对模型贡献最大,这些基因显著富集于血管生成等癌症特征通路,且与TCGA患者不良预后相关。

在"空间转录组应用"中,研究者创新性地整合恶性概率、特征活性和病理评分,在8个ST数据集实现平均0.800平衡准确率。预测的恶性区域显示更高的CNV水平(如乳腺癌1q/8q增益)和肿瘤特征活性,且与病理注释高度一致。与Cottrazm等专用ST工具相比,scMalignantFinder无需重新训练即可实现可比性能。

这项研究通过三大创新解决了恶性细胞鉴定难题:首创"癌种特征校准"训练集构建策略,突破性地联合共享与特异DEGs作为特征,实现从单细胞到空间尺度的多维度应用。特别值得注意的是,模型识别的关键DEGs显著富集于已批准药物靶点(OR=1.9),为泛癌治疗靶点发现提供了新线索。未来通过扩展训练癌种和整合多组学数据,scMalignantFinder有望成为肿瘤基础研究与临床应用的"标准分析工具",为揭示癌变机制和开发精准疗法开辟新途径。

婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婇柍瑙勫劤娴滈箖鏌i悢鐓庝喊婵℃彃婀遍埀顒冾潐閹稿摜鈧稈鏅濋埀顒勬涧閵堟悂寮崒鐐村€锋い鎺嶇劍閻﹀酣姊虹拠鎻掝劉缂佸甯″畷婵嬪箳濡も偓缁€澶愭煟閺冨倸甯舵潻婵囩節閻㈤潧孝婵炶尙濞€瀹曟垿骞橀幇浣瑰兊閻庤娲栧ú銊╂偩閾忓湱纾介柛灞剧懅椤︼附淇婇锝囩煉鐎规洘娲熼、鏃堝川椤栵絾绁梻浣瑰缁诲倿鎮ч幘婢勭喓鈧綆鍠楅悡娆愮箾閼奸鍤欐鐐达耿閺屾洟宕堕妸銉ユ懙閻庢鍣崜鐔肩嵁瀹ュ鏁婇柣锝呮湰濞堟悂姊绘担钘変汗闁烩剝妫冨畷褰掓惞椤愶絾鐝烽梺绉嗗嫷娈曟い銉ョ墦閺屾盯骞橀懠顒夋М婵炲濯崹鍫曞蓟閺囥垹骞㈡俊銈咃工閸撻亶鏌i姀鈺佺仭濠㈢懓妫楀嵄闁圭増婢橀~鍛存煟濞嗗苯浜惧┑鐐茬湴閸婃洟婀侀梺鎸庣箓濡瑧绮堢€n喗鐓冪憸婊堝礈濮橆厾鈹嶉柧蹇氼潐瀹曟煡鏌涢幇銊︽珖妞も晝鍏橀弻銊モ攽閸℃瑥鈪靛┑鈽嗗灠椤戝寮诲☉銏犵闁瑰鍎愬Λ锟犳⒑鐠囧弶鍞夊┑顔哄€楃划姘舵焼瀹ュ懐顦ㄥ銈嗘尵婵兘顢欓幒妤佲拺閻犲洠鈧櫕鐏侀梺鍛婃煥妤犳悂鍩㈤幘璇茬闁挎棁妫勫▓銉ヮ渻閵堝棛澧紒顔肩焸閸╂盯寮介鐔哄幈濠电偛妫欓崝鏇㈡倶閳哄偆娈介柣鎰级閸犳﹢鏌熼姘毙х€殿噮鍣e畷鎺懳旀担瑙勭彃

10x Genomics闂傚倷绀侀幖顐﹀磹閻熼偊鐔嗘慨妞诲亾妤犵偞鐗犻垾鏂裤€掓刊鐖剈m HD 闂佽瀛╅鏍窗閹烘纾婚柟鍓х帛閻撴洘鎱ㄥΟ鐓庡付闁诲繒濮烽埀顒冾潐濞叉粓宕伴幘鑸殿潟闁圭儤顨呴獮銏℃叏濮楀棗澧┑顔煎暣濮婃椽宕ㄦ繝鍌滅懆濠碘槅鍋呯划宥夊Φ閺冨牆绠瑰ù锝囨嚀娴犮垽姊洪幖鐐插姉闁哄懏绮撻幃楣冩焼瀹ュ棛鍘遍棅顐㈡搐椤戝懏鎱ㄩ埀顒€鈹戦悙瀛樼稇婵☆偅绮撴俊鐢稿箛閺夊灝宓嗛梺缁樶缚閺佹悂鎮℃担铏圭=濞达絽鎲″﹢鐗堜繆閻愯埖顥夐摶鐐烘煕瑜庨〃鍛矆閸℃稒鐓曢柍鈺佸暈缂傛岸鏌嶈閸忔稓鍒掑▎鎾虫瀬鐎广儱顦伴弲鎼佹煥閻曞倹瀚�

濠电姷鏁搁崑娑樜涙惔銊ュ瀭闁兼祴鏅滃畷鏌ユ倵閿濆骸浜為柍缁樻閹鏁愭惔鈥崇缂備椒鑳跺▍澧俰st闂傚倷绶氬ḿ褍螞濡ゅ懏鏅濋柨婵嗘川缁犳柨顭块懜闈涘婵☆偅蓱閵囧嫰骞樼捄杞扮捕缂傚倸绉崇欢姘跺蓟濞戙垹鍐€闁靛ě鍐f嫛婵犵數鍋涢悧濠囧储椤ョSPR缂傚倸鍊烽悞锔剧矙閹烘鍎庢い鏍仜閻掑灚銇勯幒鍡椾壕濡炪倧缂氶崡鎶藉箖瑜斿畷顐﹀Ψ閵堝棗濯伴梻渚€鈧偛鑻晶鏉戔攽閳ユ剚鍤熼柍褜鍓ㄧ紞鍡涘礈濮樿泛姹查柍鍝勬噺閸婂灚绻涢幋鐐垫噧濠殿喖鍟撮弻娑㈠籍閹炬潙顏�

闂傚倷绀侀幉锟犮€冮崱妞曞搫饪伴崨顓炵亰闂婎偄娲︾粙鎺楀吹閸曨垱鐓熼柟閭﹀墻閸ょ喖鏌曢崼鐔稿唉妤犵偞鐗犲鍫曞箣閻樻鍞堕梻浣告啞閻熴儱螞濠靛棭娼栧┑鐘宠壘鎯熼梺闈涱檧缁茬厧霉閻戣姤鐓熼柣妯夸含閸斿秶鎲搁弶鍨殻闁诡喓鍎甸弫鎾绘晸閿燂拷 - 濠电姷鏁搁崕鎴犲緤閽樺鏆︽い鎺戝閻鏌涢埄鍐$細妞も晜鐓¢弻娑㈠焺閸愭儳姣€闂佸湱鍎ら幐楣冦€呴悜钘夌閺夊牆澧界粔鐢告煕鎼淬垹鐏ラ柍钘夘樀楠炴﹢顢涘顐㈩棜婵犵數鍋為崹鍫曞箹閳哄倻顩叉繝濠傚暟閺嗭箓鏌i弮鍥仩缁炬儳銈搁弻娑㈠焺閸愵厼顥濋梺鍛婃⒐鐢繝骞冨Δ鍛嵍妞ゆ挾鍋樺Σ鎰版⒑缂佹ḿ鈯曢柣鐔濆洤绠悗锝庡枛缁犳煡鏌熸导瀛樻锭闁诡喕绶氬娲川婵犲倻顑傛繝鈷€鍕垫疁鐎殿喗濞婇幃銏ゆ偂鎼达綆鍞规俊鐐€栭弻銊╂倶濠靛牏鐜绘繛鎴欏灪閻撴瑩鎮归妸銉Ц闁稿﹤顭烽幃鐑藉閵堝棛鍘卞┑鐐叉閿氶柣蹇嬪劜閵囧嫰顢曢姀鈺佸壎閻庤娲滄繛鈧€殿喕绮欓、鏍敃閿濆懏璇為悗娈垮枟閹倿寮幘缁樻櫢闁跨噦鎷�

婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婃い鎺嗗亾鏉╂繃绻濋悽闈浶㈤悗姘煎櫍閹本鎯旈妸锔惧幘閻庤娲栧ú銈嗙濠婂牊鐓曢柣鎰摠鐏忥箓鏌熼挊澶娾偓濠氬焵椤掑﹦绉甸柛鎾村哺椤㈡棃濡舵径瀣化闂佽澹嬮弲娑欎繆閾忓湱纾奸柕濞у喚鏆梺鐟板槻閹冲酣銈导鏉戠闁靛ě鈧崑鎾寸節濮橆厾鍘搁柣搴秵閸嬪嫭鎱ㄩ崼銉︾厸鐎光偓閳ь剟宕版惔銊ョ厺闁哄啫鐗嗛崡鎶芥煟濡寧鐝慨锝呭閺岋絾鎯旈姀鈶╁闂佸憡姊圭敮鈥崇暦濠靛鍋勯柣鎾冲閵夆晜鐓ラ柣鏇炲€圭€氾拷

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号