基于分类学自适应神经网络解析微生物组-宿主性状关联的创新方法

《Microbiome》:Modeling microbiome-trait associations with taxonomy-adaptive neural networks

【字体: 时间:2025年03月30日 来源:Microbiome 13.8

编辑推荐:

  编辑推荐:针对微生物组数据高维度、稀疏性和噪声等挑战,Yifan Jiang团队开发了MIOSTONE模型,通过模拟真实分类学层级结构构建神经网络,在10个模拟和真实数据集中实现疾病状态精准预测(AUROC提升13.7%),同时提供可解释的微生物-疾病关联图谱,为微生物组机制研究提供新范式。

  人体微生物组作为"第二基因组",在糖尿病、阿尔茨海默病等疾病中发挥关键作用。然而宏基因组数据存在三大分析瓶颈:样本特征比失衡(高维稀疏)、技术噪音(测序深度差异)、生物复杂性(微生物互作)。传统方法如随机森林或XGBoost难以捕捉层级生物学关系,而现有树感知模型(如TaxoNN)仅将分类学信息用于预处理阶段。美国研究人员开发的MIOSTONE模型创新性地将基因组分类数据库(GTDB)的8层分类体系(涵盖12,258个物种)编码到神经网络架构中,每个神经元对应特定分类单元,通过随机门控机制动态选择个体或群体特征表达方式。该研究整合5折交叉验证(20次重复)评估10个数据集(7真实+3模拟),采用DeepLIFT等三种特征归因方法解析关键微生物-疾病关联。

关键技术包括:1)基于Woltka v0.1.4的宏基因组分类流程;2)采用硬混凝土分布(hard concrete distribution)实现可微分随机门控;3)分层维度压缩算法(α=0.6);4)迁移学习框架验证知识转移效果;5)通过主成分分析(PCA)评估潜在表征质量。

研究结果显示:在疾病预测方面,MIOSTONE在AUPRC指标上较次优方法平均提升3.8%,其中炎症性肠病(IBD)亚型区分任务中AUROC达0.91。控制实验证实分类学编码架构比系统发育编码(WoL v2)性能提升9.2%。迁移学习实验中,使用1158例HMP2数据预训练后,小样本IBD数据集(174例)预测性能提升17%。表征学习分析发现,物种层级神经元即可有效分离克罗恩病(CD)和溃疡性结肠炎(UC)(轮廓系数0.38)。特征归因鉴定出普雷沃菌属(Prevotella)在UC中显著富集(p<0.001),与临床报道一致。

讨论部分指出:该研究首次实现分类学约束与神经网络的可解释性统一,其分层维度压缩策略将参数量减少60%。局限性在于高阶微生物互作尚未量化,未来可结合SHAP交互检测方法。作者强调该方法无需零值插补,直接处理技术零值(technical zeros),为微生物组生物标志物发现提供新工具。论文提出的"分类学自适应"框架可扩展至病毒组或功能基因分析,相关代码已在GitHub开源。这项发表于《Microbiome》的研究为理解微生物-宿主互作提供了兼具预测精度和生物学解释力的新一代分析方法。

涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒

10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�

娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功

鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�

涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号