《Scientific Reports》:Quantitative prediction of disinfectant tolerance in Listeria monocytogenes using whole genome sequencing and machine learning
编辑推荐:
在食品安全备受关注的当下,单核细胞增生李斯特菌(Listeria monocytogenes )引发的感染问题突出。为探究其对消毒剂耐受性的预测方法,研究人员开展基于全基因组测序(WGS)和机器学习(ML)的研究。结果显示能有效训练模型预测耐受性和最低抑菌浓度(MIC),该成果为食品生产消毒监测提供新方向。
在食品安全的大舞台上,单核细胞增生李斯特菌(
Listeria monocytogenes )是一个不容忽视的 “反派角色”。它主要通过食物传播,能引发严重的李斯特菌病,尤其对胎儿、新生儿、老年人以及孕妇和免疫功能低下人群危害极大。尽管发病率相对较低,但未经治疗的感染死亡率高,这使得它成为食品安全领域重点关注的病原体。许多国家为保障食品安全,对食品中的单核细胞增生李斯特菌制定了严格规定,部分国家甚至对即食食品采取 “零容忍” 政策 。
然而,单核细胞增生李斯特菌在自然界广泛存在,食品生产过程中的原材料、工作人员、设备等都可能成为污染源,且一旦污染,其在生产环境中能长期存活。消毒剂是预防污染和感染的重要手段,季铵化合物(QACs)是食品行业常用的消毒剂之一,但单核细胞增生李斯特菌对 QACs 的敏感性研究存在诸多问题,如缺乏标准化实验方案,不同研究结果差异大,难以比较最低抑菌浓度(MIC)值。此外,从基因组数据预测消毒剂耐受性的研究较少,且尚无针对食品安全背景下单核细胞增生李斯特菌的相关研究。
为了解决这些问题,来自丹麦技术大学国家食品研究所等机构的研究人员开展了一项重要研究,相关成果发表在《Scientific Reports》上。
研究人员用到的主要关键技术方法包括:首先,从大型表型和基因组特征研究中获取 1649 株单核细胞增生李斯特菌的 WGS 数据、MIC 值及其他元数据,这些菌株来源于北美和欧洲的不同环境。然后,比较单核苷酸多态性(SNP)和泛基因组基因簇特征这两种遗传输入,分别进行特征提取。最后,运用多种机器学习算法构建模型,通过 BenchmarkDR 管道筛选模型,采用分组 k 折交叉验证结合系统发育信息,减少因样本相关性导致的过拟合问题 。
研究结果如下:
Pan-genome 特征在预测 BC 耐受性上更具优势 :对比使用 pan-genome 特征(n = 14 , 531 )和 SNP 特征(n = 316 , 084 )作为输入的多种 ML 模型预测性能,发现对于 BC 耐受性分类,14 个模型中有 13 个使用 pan-genome 特征的交叉验证平衡准确率(BA)得分更高;在回归任务中,7 个模型里有 5 个基于 pan-genome 特征训练时均方误差更低1 2 。
筛选出表现优异的 ML 模型 :对多种 ML 模型进行预筛选,分类任务中梯度提升树分类器 BA 得分高达 0.98;回归任务中随机森林和梯度提升树回归器表现最佳,均方误差分别为 0.09(未转换 MIC 值回归)和 0.28(l o g 2 ? 转换 MIC 值回归) 。
不同聚类方法对模型性能影响较小 :研究三种聚类方法(CC、kmer95 和 popPUNK clusters)对模型预测性能的影响,发现它们之间的归一化互信息得分较高,表明聚类结果一致性良好。分类和回归任务结果显示,不同聚类方法下模型性能差异不显著3 。
确定关键特征 :通过 SHAP 值进行特征重要性分析,发现分类任务中,排名前十的特征里有 qacC、ebrB 等,与已知的 QAC 耐药机制相关;回归任务中,top2 特征为 group 8378(emrE)和 group 10,893(qacH),均与 QAC 耐受性机制有关4 5 6 。
模型在独立测试集上表现各异 :用独立测试集评估分类模型性能,发现不同模型表现差异大。LR_L1 在多个数据集和总体上表现最佳,GBT 分类器表现最差,其预测性能与随机猜测无异7 。
对其他 QAC 消毒剂预测效果良好 :对 DDAC 和 MIDA 这两种消毒剂进行预测研究,结果显示许多 ML 模型表现相似。LR_L1、ABT 和 SVM_L1 在预测 DDAC 和 MIDA 耐受性时表现相近,且用 DDAC 模型预测 MIDA 表型,平衡准确率得分可达 0.96 。
研究结论和讨论部分指出,本研究首次利用 WGS 数据对单核细胞增生李斯特菌消毒剂耐受性进行大规模预测,构建的 ML 模型在预测耐受性和 MIC 值方面展现出良好潜力。不过,研究也存在一定局限性,如实际应用中消毒剂多为复方产品,研究仅考虑了单一物种培养的表型数据,未涉及生物膜等复杂因素。但该研究仍是从 WGS 数据预测消毒剂耐受性、应用于食品工业的重要开端,为后续研究指明了方向,有望助力食品行业制定更有效的消毒计划,提升食品安全水平。
閹垫捁绁�
娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴f洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀
10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�
濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�
閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞e崬鍙嗘禍鍡毿掓禒搴n儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�
娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�