Feature Selection: Unveiling the Key to Optimizing scRNA-seq Data Integration and Querying

【字体: 时间:2025年03月14日 来源:Nature Methods 36.1

编辑推荐:

  研究人员针对单细胞 RNA 测序(scRNA-seq)数据整合和查询问题,评估多种特征选择方法,发现高变特征选择表现出色,为相关研究提供重要指导。

  在生命科学领域,单细胞转录组学技术的兴起为构建参考细胞图谱带来了新的契机。通过单细胞 RNA 测序(scRNA-seq),科学家们能够深入了解细胞的基因表达情况,探索细胞的异质性和功能。然而,随着 scRNA-seq 数据集的不断增加,如何有效整合这些数据并准确地进行查询成为了一个关键问题。
目前,已有大量的计算方法用于单细胞数据的整合,至少 250 种工具可供选择。但此前的研究大多聚焦于整合方法本身,对于可能影响整合效果的预处理步骤关注较少,其中特征选择的最佳方法尚未得到充分评估。此外,当使用整合后的空间作为参考来分析新的查询样本时,选择特征是否会导致参考样本的更好整合,同时又忽略与理解其他样本相关的生物变异来源,这一问题也有待解决。

为了深入探究这些问题,来自德国亥姆霍兹慕尼黑计算生物学研究所、慕尼黑工业大学等机构的研究人员开展了一项全面的研究。他们评估了 24 种特征选择方法的变体,在 10 个数据集上进行了超过 6000 次的整合运行,生成了超过 140000 个指标分数。研究结果发表在《Nature Methods》上,为单细胞数据的分析提供了重要的指导。

研究人员在研究中使用了一系列关键技术方法。首先,他们精心挑选了代表不同场景的数据集,涵盖了不同组织、技术和发育阶段。通过标准的预处理流程,将数据集划分为参考样本和查询样本。接着,运用多种特征选择方法处理参考样本,再利用单细胞变分推理(scVI)等模型进行数据整合,并将查询样本映射到整合后的参考空间。之后,训练分类器进行标签转移,通过一系列精心挑选的指标评估整合和查询映射的效果。

在研究结果部分,首先是指标选择的关键作用。研究人员收集了多种评估整合和查询映射的指标,但这些指标的行为此前未被充分研究。通过对不同大小的随机和高变特征集进行整合和映射,计算指标分数并比较结果,研究人员筛选出了有效衡量性能、与技术因素关联不大且不冗余的指标。

其次,特征数量对性能的影响显著。研究发现,所选特征的数量会影响整合和查询映射的成功与否。不同的指标类别呈现出不同的趋势,例如,批次校正相关的指标在小特征集时得分较高,而衡量生物变异的指标则在特征数量增加后先上升后趋于平稳或下降。综合来看,总体得分在选择 500 - 5000 个特征时达到峰值。

再者,高变特征和监督方法表现出色。在比较不同的特征选择方法后,研究发现基于方差稳定变换的高变特征选择方法(Seurat-VST/scanpy-SeuratV3)排名最高,标签引导的标记基因(Wilcoxon)方法也表现良好,但在不同数据集上的差异较大。

另外,批次感知特征选择的效果并不一致。研究人员评估了 scanpy 中批次感知变体方法的有效性,发现其在某些场景下能提高性能,但在其他场景下表现较差,整体效果并不稳定。

同时,谱系特异性特征选择和整合也得到了探讨。通过对人类肺细胞图谱(HLCA)数据集的子集分析,研究人员发现没有明显的方法偏好,且使用更具多样性的参考图谱更容易区分新的细胞群体。

最后,所选特征与整合方法之间存在相互作用。研究人员比较了 scVI、scANVI 和 Symphony 等不同整合方法,发现 scANVI 在大多数指标类别上表现更优,而 Symphony 在检测新细胞群体方面表现较差。

研究结论和讨论部分指出,这项研究全面评估了特征选择对 scRNA-seq 数据整合和查询的影响,验证了高变特征选择方法的有效性,为研究人员在处理单细胞数据时选择合适的特征选择方法提供了重要参考。然而,研究也存在一些局限性,如计算量过大导致无法对所有方法测试不同数量的特征,且未充分考虑技术特征对最佳特征数量的影响。未来,开发自动调整所选特征数量的方法将是一个重要的研究方向。总之,该研究成果对于推动单细胞转录组学的发展,助力构建高质量的细胞图谱,以及深入理解细胞的生物学功能具有重要意义。

娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴f洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀

10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�

濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�

閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞e崬鍙嗘禍鍡毿掓禒搴n儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�

娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号