巴斯克海岸河口沉积物基因目录:揭示微生物暗物质与生态系统功能的新资源
《Scientific Data》:The Basque Coast Estuarine Sediment Gene Catalogue
【字体:
大
中
小
】
时间:2025年12月05日
来源:Scientific Data 6.9
编辑推荐:
本研究针对河口生态系统微生物功能认知空白,通过宏基因组学技术对巴斯克海岸12个河口92个沉积物样本进行深度解析,重构了471个中高质量宏基因组组装基因组(MAG)和1.08亿个推定基因,构建了首个涵盖细菌、古菌、真核生物和病毒的河口沉积物基因目录。该资源为揭示微生物驱动的碳循环、污染物降解等生物地球化学过程提供了关键数据支撑,对海岸带生态保护与生物技术开发具有重要价值。
河口作为连接海洋、河流和陆地生态系统的关键过渡带,承载着潮间带泥滩、盐沼等重要栖息地。这些动态复杂的生态系统是生物多样性热点,通过微生物、中小型底栖生物群落驱动养分循环、污染物去除等生态功能。然而,随着海岸带污染、富营养化、栖息地破坏等人为压力加剧,人们对这些生态系统的功能机制及其响应机制仍存在显著认知缺口,尤其在碳封存、储存和再矿化等关键过程方面。
为填补这一空白,由Ion L. Abad-Recio领衔的国际研究团队在《Scientific Data》发表了题为“巴斯克海岸河口沉积物基因目录”的研究,通过对巴斯克监测网络(BMN)29个站点92个沉积物样本进行宏基因组测序,构建了迄今规模最大的河口沉积物基因资源库。该研究不仅揭示了微生物群落的组成与功能潜力,更为理解人类活动对海岸带生态的影响提供了分子水平的新视角。
研究团队采用全基因组鸟枪法测序(whole genome shotgun sequencing)获得3.35 Tbp基因组数据,通过MEGAHIT进行92个独立组装和2个时间序列样本的共组装,获得1.58亿条contigs(平均N50为911)。利用Prodigal基因预测工具鉴定出1.08亿个非冗余推定编码序列(ORFs),其中78%可映射到COG(Clusters of Orthologous Groups)数据库,59%映射至KEGG(Kyoto Encyclopedia of Genes and Genomes)直系同源群,52%映射至PFAM数据库。通过多轮分箱(binning)和CheckM质量评估,最终获得81个高质量(完整性>90%,污染<5%)和390个中等质量(完整性>75%,污染<10%)宏基因组组装基因组(MAGs)。
基因目录涵盖95M细菌、586k古菌、754k真核生物和36k病毒序列,其中11%未分类。尽管Prodigal主要适用于原核基因预测,但仍有大量真核和病毒ORFs被成功注释,暗示该目录在跨域功能分析中的潜力。
研究采用标准化生物信息学流程,包括Cutadapt去接头、FastQC质控、Clumpify去重复和SqueezeMeta管道进行基因注释。通过DIAMOND进行COG/KEGG同源性搜索,HMMER进行PFAM结构域注释,并利用LCA(Last Common Ancestor)算法进行 taxonomic 分类。
样本测序深度差异显著(19-570M读长对),但多数样本集中在67-143M区间。Contig数量与读长数大致成正比,但N50和覆盖度无明确趋势,提示环境样本复杂性对组装效果的影响。
基于Bray-Curtis距离的NMDS分析显示,比达索阿(Bidasoa)与奥亚尔松(Oiartzun)河口样本群落结构显著分离,反映不同人为压力梯度下微生物组成的适应性分化。
基于GTDB-tk的MAG分类显示,优势细菌类群为γ-变形菌纲(Gammaproteobacteria)和拟杆菌纲(Bacteroidia),古菌则以广古菌门(Euryarchaeota)为主,凸显河口沉积物特有的微生物资源特征。
该研究构建的基因目录与MAG资源为河口生态系统功能解析提供了多维度数据支撑。通过整合环境 metadata(如有机质含量、重金属与多环芳烃浓度),未来可进一步挖掘微生物功能指标与环境污染的关联机制。尽管真核ORFs的预测存在局限性,但该资源仍为生物技术开发(如生物修复基因挖掘)提供了重要靶点库。所有原始数据已存储于欧洲核苷酸档案库(ENA,PRJEB83861),衍生数据可通过BioStudies(S-BSST181515)获取,为全球海岸带研究共同体提供了可重复利用的基础资源。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号