金线莲单倍型解析染色体级别基因组破译及其药用成分进化遗传基础

《Scientific Data》:A haplotype-resolved genome assembly of Anoectochilus roxburghii

【字体: 时间:2025年12月04日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对药用植物金线莲(Anoectochilus roxburghii)基因组复杂性高、遗传背景不清的问题,通过整合PacBio HiFi、Hi-C和Illumina等多组学技术,首次完成其单倍型解析染色体级别基因组组装。最终获得大小为1.92 Gb/1.93 Gb、Contig N50达22.72 Mb/22.17 Mb的高质量基因组,注释26,239/26,324个蛋白编码基因,揭示其独特基因家族扩张(2,100个)与适应性进化机制,为解析黄酮类等活性成分生物合成通路提供关键遗传资源。

  
在传统中医药宝库中,金线莲(Anoectochilus roxburghii)以其独特的药用价值和食疗功效被誉为“药王”。这种兰科多年生草本植物富含黄酮类、生物碱、多糖等活性成分,在抗肿瘤、抗氧化、降血糖等方面展现出显著药理活性。然而,其基因组高度杂合、重复序列占比超过75%,长期以来缺乏高质量基因组参考序列,严重制约了药用成分生物合成机制解析和分子育种研究。
为突破这一瓶颈,福建中医药大学徐文、高敏等研究团队在《Scientific Data》发表了首个金线莲野生材料“小叶桠”的单倍型解析染色体级别基因组。研究通过整合PacBio HiFi长读长测序(162.58 Gb,78×覆盖度)、Hi-C染色体构象捕获(188.98 Gb)和Illumina短读长数据,采用HiFiasm进行单倍型分型,结合ALLHiC将contig锚定至20条伪染色体。最终获得的单倍型A和B基因组大小分别为2.06 Gb和2.07 Gb,Scaffold N50突破104 Mb,BUSCO完整性评估达93.5%和92.9%。
关键技术方法
研究采用多组学整合策略:通过K-mer分析(K=39)估算基因组特征(1.92 Gb,杂合率2.19%);利用HiFiasm v0.23.0完成单倍型分型组装;使用RepeatMasker和DeepTE注释重复序列(占比76.54%-76.68%);结合de novo预测、转录组和同源比对注释蛋白编码基因;基于343个单拷贝直系同源基因构建系统发育树,并通过CAFE 5分析基因家族扩张/收缩。
基因组组装与注释特征
K-mer分析显示金线莲基因组呈现典型高杂合特征,为单倍型分型提供理论依据。组装后contig N50达22 Mb级别,Hi-C互作热图显示清晰的染色体内交互信号,证实组装准确性。
重复序列注释发现Gypsy类LTR逆转录转座子占基因组46.60%-49.24%,Copia类占比8.49%-9.03%,揭示转座子扩张是基因组膨大的主要驱动力。基因注释共预测5.2万余个蛋白编码基因,其中黄酮合成通路关键酶基因(如CHS、F3H)呈现显著扩张。
比较基因组与进化分析
与4种兰科植物(蝴蝶兰、石斛、天麻、深圳拟兰)比较发现金线莲特有1,060个基因家族,涉及次生代谢物转运与胁迫响应。系统发育分析表明金线莲与石斛分化于约67百万年前,其基因家族扩张(2,100个)显著多于收缩(2,120个),扩张基因富集于萜类合成、氧化还原酶活性等通路。
结论与意义
该研究首次提供金线莲单倍型分辨的染色体级别基因组资源,揭示其高杂合基因组结构特征和适应性进化机制。通过鉴定黄酮合成通路关键基因家族扩张,为解析药用成分生物合成网络提供遗传基础,同时为兰科植物进化生物学研究和药用植物分子育种奠定理论基础。基因组数据已公开于GCA_976986765(单倍型A)、GCA_976986775(单倍型B)和Figshare平台(https://figshare.com/articles/dataset/Genome_of_Anoectochilus_roxburghii/28163756),推动药用植物基因组学研究进入单倍型时代。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号