基于全基因组的利马豆短序列重复标记发掘及其在遗传多样性研究中的应用
《Scientific Reports》:Genome-wide discovery of short sequence repeat markers useful for genetic diversity studies in Lima bean (Phaseolus lunatus L.)
【字体:
大
中
小
】
时间:2025年12月07日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对利马豆(Phaseolus lunatus L.)遗传结构研究匮乏的现状,利用全基因组重测序(WGS)数据,首次在全基因组范围内系统发掘了109,698个短序列重复(SSR)标记,并对60份野生和栽培利马豆材料进行了in silico基因分型。研究发现SSR标记能有效揭示利马豆的遗传结构,量化了驯化过程中的奠基者效应,并鉴定出与驯化性状相关的异常位点(outlier loci)。该研究为利马豆的遗传多样性分析、功能基因挖掘及分子育种提供了宝贵的标记资源。
在全球人口持续增长和气候变化加剧的双重压力下,寻找具有气候适应性的新型粮食作物变得尤为重要。菜豆属(Phaseolus)的利马豆(Phaseolus lunatus L.),作为一种被忽视的豆类作物,因其广泛的生态适应性而展现出应对气候变化的巨大潜力。然而,与广泛研究的普通菜豆(P. vulgaris)相比,利马豆的遗传背景研究相对滞后,其遗传结构、驯化历史以及重要性状的遗传基础仍不清晰。传统上,单核苷酸多态性(SNP)标记是基因组学时代遗传多样性研究的主流工具,但短序列重复(SSR),即微卫星标记,因其在物种内高度可变、分布广泛,且可能位于基因编码区或调控区从而直接影响基因功能,在个体鉴定、亲缘关系分析以及关联分析中仍具有独特价值。特别是在只能对有限数量标记进行基因分型的情况下,少数高度多态的SSR位点可能提供与数千个SNP位点相当的信息量。尽管已有研究对利马豆进行了全基因组SNP标记开发,但尚未有研究系统性地在全基因组范围内发掘和评估SSR标记。因此,开发利马豆全基因组SSR标记资源,并比较其与SNP标记在揭示遗传多样性模式上的异同,对于深入理解利马豆的进化历史并推动其遗传改良具有重要意义。
为填补这一空白,研究人员开展了一项研究,旨在全基因组范围内发掘可用于利马豆遗传多样性研究的SSR标记,并评估其在解析遗传结构、量化驯化效应以及识别与驯化相关候选基因方面的潜力。该研究以“Genome-wide discovery of short sequence repeat markers useful for genetic diversity studies in Lima bean (Phaseolus lunatus L.)”为题,发表在《Scientific Reports》上。
研究主要采用了生物信息学分析结合实验验证的技术路线。首先,利用已发表的利马豆参考基因组,通过GMATA软件进行全基因组SSR位点扫描。其次,利用先前产生的60份野生和栽培利马豆材料的全基因组重测序(WGS)数据,通过HipSTR软件对识别出的SSR位点进行in silico(计算机模拟)基因分型。这60份材料涵盖了利马豆的两个主要基因库:中美洲(Mesoamerican)基因库和安第斯(Andean)基因库。随后,对基因分型结果进行过滤和质量控制,并利用多种群体遗传学方法(如主成分分析PCA、Structure分析、遗传距离计算等)评估遗传结构,并与已发表的SNP数据进行比较。此外,通过计算期望杂合度(HE)、固定指数(FST)等参数量化遗传多样性及驯化奠基者效应,并筛选潜在的受选择位点(异常位点)。最后,选取了16个位于基因内部且可能与农艺性状相关的异常SSR位点,通过PCR扩增和Sanger测序进行了实验验证。
Identification of SSR loci and its genomic distribution
研究人员利用GMATA软件从利马豆参考基因组中共识别出109,698个SSR位点,其密度约为每Mb 200个SSR位点,在已研究的豆科植物中属于较低水平。这些SSR位点遍布11条染色体,其中二核苷酸和三核苷酸重复最为丰富,占97%以上。16%的SSR位点(17,403个)分布在基因区域内,涉及9,796个蛋白质编码基因(占基因总数的35%)。SSR位点的重复次数越多,其出现频率越低,且富含AT碱基。
Genotyping and annotation of SSR loci
利用HipSTR软件,成功对60份材料中的27,376个SSR位点进行了in silico基因分型。分析显示,平均基因多样性(hE)随重复单元长度的增加而呈上升趋势。对基因分型SSR位点的注释表明,37%位于基因区域,63%位于基因间区。在基因区域内,SSR更常见于内含子、转录起始位点上游等对基因功能影响可能较小的区域,而在外显子剪接区等关键功能区域则较少见。基因本体(GO)富集分析显示,含有SSR的基因显著富集于代谢调节、发育过程、转录调控、蛋白结合等生物学功能和通路。
Genetic diversity analyses
基于27,376个SSR位点的分析成功将60份利马豆材料划分为中美洲和安第斯两大基因库,以及各自的野生和栽培群体,其结果与基于372,757个SNP位点的分析高度一致。不过,SSR标记在区分基因库内部野生与栽培群体方面表现更佳,而SNP标记在区分两大基因库间遗传距离方面更为敏感。遗传多样性估算显示,中美洲基因库的驯化导致遗传多样性(期望杂合度HE)降低了50%,而安第斯基因库降低了33%。利用SNP数据估算的奠基者效应分别为45%(中美洲)和10%(安第斯),均表明中美洲基因库经历了更强烈的驯化瓶颈。
Detection of outlier loci
通过筛选在驯化奠基者效应和FST值(衡量群体分化)分布中均处于前10%的位点,研究人员分别在中美洲和安第斯基因库中鉴定出211个和123个异常SSR位点,其中仅有6个位点为两个基因库所共享,暗示两地驯化可能遵循不同的遗传路径。GO富集分析表明,这些异常位点相关的基因功能涉及核苷酸代谢、角质合成、胁迫响应、甾醇代谢等可能与农艺性状相关的通路。进一步分析发现,54个异常位点位于52个基因内部,且其变异类型(如移码突变、错义突变、剪接位点变异等)可能影响基因功能,这些基因与干旱响应、种子休眠、生物/非生物胁迫抗性、花器官发育等性状相关。
Experimental validation of candidate SSR loci
为验证in silico基因分型的可靠性,研究人员选取了16个位于基因内部且可能与驯化或农艺性状相关的异常SSR位点进行PCR扩增和Sanger测序验证。例如,位于基因Pl01G0000011200(推测参与干旱响应)内的一个(TAA)5重复,以及位于基因Pl05G0000278900(推测为组氨酸磷酸转运蛋白,负调控干旱响应)剪接供体位点的一个(GTAT)5重复。测序结果均成功验证了in silico分析所检测到的等位基因长度多态性,证实了该研究策略的可行性。
综上所述,本研究成功构建了利马豆全基因组范围内的SSR标记图谱,并证明这些标记是进行遗传多样性分析和群体结构研究的有效工具。研究发现SSR标记与SNP标记在揭示利马豆主要遗传分化方面结果高度一致,但在解析更细微的群体结构(如区分野生和栽培群体)时可能具有独特优势。研究量化了利马豆在两个独立驯化中心经历的不同程度遗传瓶颈,并鉴定出一批可能受选择且与重要农艺性状相关的SSR异常位点。这些位点为进一步研究利马豆驯化的遗传基础以及重要性状的功能基因挖掘提供了宝贵的候选资源。此外,研究还展示了利用全基因组重测序数据批量发掘和基因分型SSR标记的可行性,为其他非模式作物的类似研究提供了范例。这项研究不仅丰富了利马豆的基因组资源,也为利用SSR标记进行功能基因组学和分子标记辅助育种奠定了基础,对推动这种具有气候适应潜力的弱势作物的遗传改良具有重要意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号