编辑推荐:
糖脂(GSLs)结构复杂,功能多样,其结构变化与多种疾病相关。当前分析工具存在局限,难以满足需求。研究人员开发 DANGO(Data ANnotation system for GlycolipidOmics)工具,可自动注释糖脂组学数据集,提高注释效率和准确性,推动糖脂组学研究。
在生命的微观世界里,细胞表面的糖鞘脂(Glycosphingolipids,GSLs)如同神秘的 “小钥匙”,虽小却掌管着众多重要 “大门”。它们参与细胞生长、信号传导、分化等一系列关键过程,还在细胞与病原体的 “交锋” 中发挥着关键作用。这些功能的实现,与 GSLs 独特的结构密切相关,其聚糖和脂质部分的差异组合,造就了复杂多样的 GSLs 结构。
然而,要精准解读这些结构并非易事。目前大多数糖脂组学技术侧重于聚糖表征,却忽视了脂质部分,而脂质中神经酰胺(Ceramide,Cer)的高度异质性更是让 GSLs 的全面分析困难重重。同时,现有的计算工具在面对糖脂组学数据时也 “力不从心”,难以适应其复杂的结构特点和分析需求。正因如此,开发一种能够全面、高效分析 GSLs 结构的工具迫在眉睫。
为了解决这一难题,来自多个研究机构的研究人员(文中未明确具体单位)踏上了探索之旅,他们开展了关于糖脂组学质谱数据注释工具的研究,最终成功开发出 DANGO(Data ANnotation system for GlycolipidOmics)这一创新工具,并将研究成果发表在《BBA Advances》上。这一工具的诞生意义非凡,它打破了传统工具的局限,为糖脂组学研究开辟了新的道路,让科研人员能更深入地探究 GSLs 的奥秘,有望为相关疾病的诊断和治疗带来新的突破。
在研究过程中,研究人员主要运用了以下关键技术方法:首先,采用直接进样、纳米喷雾电离、多维质谱(NSI - MSn)技术分析完整的、甲基化的 GSLs,获取丰富的质谱数据;其次,将 DANGO 作为 GRITS Toolbox 的扩展,利用其现有功能进行数据处理和管理,并添加新的注释算法和数据库管理系统;此外,通过自定义的聚糖和脂质数据库,结合用户设定的参数进行候选离子生成、匹配和评分,实现对 GSLs 结构的自动注释。
研究结果
- 片段生成:研究人员利用商业 GSL 标准品,通过超高分辨率质谱在两种不同仪器、两种激活模式下监测 GSL 的碎片化途径。发现甲基化 GSLs 的聚糖碎片化和中性丢失与游离聚糖相似,神经酰胺部分则以特定的 C/Z 型片段、酰胺键断裂和中性丢失等方式进行碎片化。在此基础上,GELATO 和 DANGO 分别计算聚糖和脂质片段质量,共同生成完整的 GSL 片段质量。
- DANGO 注释速度:对多个包含约 400 个光谱的 MS 数据集进行注释测试,结果显示,在不使用关键片段过滤器时,DANGO 注释耗时近 6.5 分钟,而使用后仅需 0.5 - 1.5 分钟,注释速度大幅提升。
- 过滤器有效性:使用关键片段过滤器后,结构注释数量显著减少,约降低 80%。手动验证过滤后的测试数据集发现,该过滤器有效去除了假阳性候选,保留了正确的注释结果。
- DANGO 注释准确性:以高分辨率质谱分析牛脑神经节苷脂混合物,在使用关键片段过滤器和 5 ppm 质量公差的条件下,DANGO 对八个主要峰的注释结果与手动注释高度一致,准确识别出主要成分,且得分较高,表明其注释准确性高。
- DANGO 的局限性:DANGO 专为分析完整的甲基化 GSLs 优化,对非甲基化聚糖效果欠佳。例如,在分析未修饰的聚糖或在负离子模式下分析神经节苷脂时,获取的结构信息有限。
研究结论和讨论
DANGO 的出现填补了糖脂组学研究工具的空白,它整合了多种功能,能够高效处理和注释糖脂组学质谱数据。通过优化的关键片段过滤器,大大缩短了注释时间,提高了注释准确性。同时,DANGO 具有良好的平台独立性,可适应不同质谱仪和电离方法产生的数据。然而,它也存在一定局限性,未来研究可致力于扩展其对非甲基化 GSLs 的分析能力,进一步提升其在生物样本分析中的实用性。
总的来说,DANGO 为糖脂组学研究提供了强大的技术支持,有助于科研人员更深入地理解 GSLs 的结构与功能关系,为揭示相关疾病的发病机制、开发诊断标志物和治疗靶点奠定了坚实基础,推动了糖脂组学领域的发展,具有重要的科学意义和应用价值。