染色体水平黑蚁(Formica fusca)基因组图谱破译社会性行为的遗传基础
《Scientific Data》:A Chromosome-level genome assembly of the black ant Formica fusca
【字体:
大
中
小
】
时间:2025年12月14日
来源:Scientific Data 6.9
编辑推荐:
本研究针对黑蚁(Formica fusca)高质量染色体级别基因组参考序列缺失的问题,研究人员整合PacBio HiFi长读长测序与Hi-C技术,成功构建了首个染色体水平的F. fusca基因组组装(535.46 Mb,锚定至27条染色体,Scaffold N50达20.27 Mb)。该组装揭示了高达68.86%的重复序列和13,269个蛋白质编码基因,BUSCO评估完整性达97.41%。该基因组资源为深入探究昆虫社会组织的分子机制和复杂社会行为的遗传基础提供了关键数据支撑。
蚂蚁,作为地球上最成功的社交昆虫之一,其复杂的社会组织、精细的分工协作以及高效的沟通系统,一直是科学家们探索生物社会性行为的理想模型。在众多蚂蚁物种中,黑蚁(Formica fusca)因其广泛分布、卓越的学习能力和多样化的社会结构,成为研究化学通讯和社会行为的明星物种。尽管此前已有研究涉及其种群结构、社会免疫和化学通讯,且Vizueta等人于2025年报道了一个支架级别的基因组草图,但一个高质量、染色体级别的基因组参考序列的缺失,极大地限制了对该物种复杂社会行为背后遗传机制的深入解析。
为了填补这一关键空白,由浙江大学昆虫科学研究所康河(Kang He)团队领衔的研究在《Scientific Data》上发表了题为“A Chromosome-level genome assembly of the black ant Formica fusca”的论文,报道了首个黑蚁染色体级别的高质量基因组组装。这项研究不仅提供了宝贵的基因组资源,更为理解蚂蚁社会性的演化基础打开了新的大门。
研究人员主要运用了几项关键技术:首先,通过流式细胞术和k-mer分析评估基因组特征;其次,利用PacBio High Fidelity (HiFi) 长读长测序技术进行从头组装,再结合高通量染色质构象捕获 (Hi-C) 技术将contig锚定到染色体水平;最后,通过整合从头预测、转录组证据和同源比对的方法进行基因预测和功能注释(包括GO、KEGG等)。所有分析均基于采集自中国吉林省长春市的样本。
蚂蚁是社会性昆虫研究的典范。黑蚁(F. fusca)以其精确的识别能力、强大的学习能力和多样的社会结构而闻名,是研究化学通讯和社会行为的优秀模型。然而,此前缺乏高质量的染色体级别基因组,限制了对该物种社会行为遗传基础的理解。
通过流式细胞术和k-mer分析两种方法评估基因组大小。流式细胞术估计的基因组大小为478.09 Mb,而k-mer分析估计为540.17 Mb,后者与最终的Hi-C组装大小(535.46 Mb)高度一致。这种差异主要与基因组中高比例的重复序列有关。k-mer分析还表明该物种的杂合率较低,为0.53%。
从单个工蚁中提取基因组DNA,使用PacBio Revio平台进行HiFi测序,产生了13.22 Gb的HiFi reads(平均读长19,489.38 bp)。使用hifiasm v0.19.6进行从头组装,获得的contig级别基因组大小为564.25 Mb,contig N50为1.38 Mb。
使用Hi-C技术将初始的contig级别组装锚定到染色体上。通过对1克全身组织进行交联、酶切、标记和连接,获得了70.15 Gb的原始Hi-C数据。经过数据处理和手动校正,最终将490.58 Mb(91.62%)的序列成功锚定到27条染色体上,Scaffold N50达到20.27 Mb。
使用RepeatModeler v2.0.5和RepeatMasker v4.1.5对重复序列进行注释。结果显示,重复序列占基因组的68.86%(368.74 Mb),其中LTR元件占比最高(40.94%)。通过整合从头预测、转录组证据和同源比对的方法,预测出13,269个蛋白质编码基因。功能注释显示,64.12%的基因在SwissProt数据库中有注释,61.87%和56.27%的基因分别获得GO和KEGG注释。
为了阐明黑蚁在蚁科中的进化地位,研究人员选取了18种其他膜翅目物种(包括17种蚁科物种和1种蜜蜂科物种作为外群)进行系统发育分析。使用OrthoFinder2鉴定了19个物种中的1,457个单拷贝直系同源群。通过串联这些基因并构建系统发育树,发现F. fusca与F. selysi亲缘关系最近,两者与Lasius、Camponotus、Cataglyphis和Formica等其他属构成一个独立的进化分支。
基于系统发育分析结果,对亲缘关系密切的F. fusca和F. selysi进行了全基因组共线性分析。结果显示两个物种的染色体之间存在高度的共线性关系,表明Formica属内染色体分化有限。
本研究产生的原始测序数据已存储于国家基因组科学数据中心(GSA: CRA045933),染色体级别组装已提交至GenBank(GCA_052642515.1)。BUSCO评估显示基因组完整性高达97.41%,Hi-C热图显示出清晰的染色体内部交互信号,与近缘物种F. selysi基因组的共线性分析进一步证实了染色体组装的准确性。
综上所述,这项研究成功构建了黑蚁(Formica fusca)首个高质量的染色体级别基因组组装,揭示了其基因组大小为535.46 Mb,包含27条染色体,重复序列含量高达68.86%,并注释了13,269个蛋白质编码基因。通过与先前发布的支架级别基因组的比较,本研究凸显了PacBio HiFi长读长测序结合Hi-C技术在准确解析复杂基因组(尤其是高重复序列区域)方面的巨大优势。该高质量的基因组资源不仅为深入探究黑蚁的社会行为、化学通讯等特性的分子机制奠定了坚实基础,也为比较基因组学研究及蚂蚁社会性进化探索提供了关键数据。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号