结合全基因组关联研究(GWAS)获得的先验信息,可以提高对泥蟹(Scylla paramamosain)体型特征的基因组预测准确性
《Comparative Biochemistry and Physiology Part C: Toxicology & Pharmacology》:Incorporating GWAS-derived prior information enhances genomic prediction for body size traits in the mud crab (
Scylla paramamosain)
【字体:
大
中
小
】
时间:2025年12月05日
来源:Comparative Biochemistry and Physiology Part C: Toxicology & Pharmacology 3.9
编辑推荐:
本研究基于346只拟态斗蟹的全基因组测序数据,结合GWAS和基因组预测分析,揭示了四个体形性状(蟹壳宽度、长度、后宽度及体高)的遗传基础。发现五个多效性基因组位点及六个候选基因(含Exportin-5和FANCI),其中三羧酸循环代谢通路显著富集。评估GFBLUP模型性能,表明基于GWAS的SNP筛选模型(使用7980-9302个SNP)较标准GBLUP准确率提升0.528-0.888,而功能注释模型提升有限。验证了低密度SNP面板结合GWAS先验知识的实用性,为甲壳类遗传改良提供新策略。
本研究针对经济价值显著的中华花蟹(Scylla paramamosain)生长性状展开系统性遗传分析。研究团队通过整合全基因组关联分析(GWAS)与基因组预测模型(GFBLUP),首次系统揭示了该物种四个关键体质量性状的遗传机制。样本采集自福建福州某商业养殖池塘,包含346只成熟个体(雄性189只,雌性157只),通过精确量具测量获得四项体质量性状数据:蟹盖宽度(CW)、蟹盖长度(CL)、蟹盖后缘宽度(PWC)和体高(BH)。各性状均呈现正态分布特征,其中蟹盖宽度平均达104.78毫米,变异系数达12.19%,四项性状标准差均超过8毫米,显示存在显著的个体间差异。
在遗传解析方面,研究构建了包含390万高质量SNP标记的全基因组关联分析框架。通过比较不同显著性阈值(如FDR 0.05与0.01)的筛选效果,发现最优平衡点出现在FDR 0.05阈值下,此时筛选出约8000个显著SNP位点。这些标记不仅揭示出五个多效性遗传位点(影响多个性状),更鉴定出包括Exportin-5和FANCI在内的六个人类已验证功能基因。特别值得关注的是,柠檬酸循环(TCA)代谢通路在KEGG富集分析中呈现高度显著性(p<0.001),提示三羧酸循环相关基因可能通过调控能量代谢间接影响生长性状。
在基因组预测模型优化方面,研究创新性地构建了双轨制GFBLUP模型评估体系。标准GBLUP模型通过全基因组SNP标记构建关系矩阵,预测精度稳定在0.78-0.85区间。当引入基于GWAS筛选的SNP集合(包含8000-9300个标记)时,GFBLUP模型预测精度显著提升,最高达到0.888的准确率,较标准模型平均提升约0.528个标准差单位。这一突破性进展表明,精准筛选的关联SNP能有效抑制非功能标记的干扰,优化基因组预测效果。
研究进一步验证了功能注释在GFBLUP模型中的应用价值。通过整合KEGG代谢通路注释的SNP标记(约2000个),构建功能驱动型GFBLUP模型,虽然预测精度较纯GWAS筛选模型有所下降(增幅0.020-0.197),但该结果与猪类(Zhang et al., 2024b)和鱼类(Song et al., 2021)研究形成对比,提示在甲壳类动物中,基于功能注释的预测模型可能需要结合特定代谢通路信息。研究特别强调,在超过5000个SNP标记的密度条件下,预测精度趋于稳定(0.837-0.865),这为实际育种工作提供了可操作的标记选择标准。
该研究在方法学层面实现了多项创新突破:首先,采用全基因组重测序(WGS)数据,较现有40K SNP芯片(Ye et al., 2025)分辨率提升约100倍,使微效基因和调控区域的解析成为可能;其次,开发动态阈值筛选算法,在保证统计效力(FDR<0.05)的前提下,最大程度保留潜在功能SNP;最后,建立多维度模型验证体系,通过交叉验证(10-fold)和留一法(LOOCV)双重检验模型稳定性,确保结果可靠性。
在遗传机制解析方面,研究揭示出独特的多效调控网络。五个多效性遗传位点分别位于第2、3、5、7和9号染色体,其中第5号染色体上的遗传位点同时调控蟹盖宽度和体高的发育。候选基因分析发现,Exportin-5基因可能通过调控多囊泡转运体介导的蛋白质分泌影响肌肉发育,而FANCI基因作为DNA损伤修复因子,其异常表达可能通过表观遗传调控间接影响生长周期。KEGG富集分析显示,柠檬酸循环相关基因(如ACLY、TCA2)富集度达p=0.00012,提示能量代谢重编程可能是体质量性状的分子调控枢纽。
该研究在应用层面取得重要突破:通过优化SNP标记选择策略,研究将有效预测模型标记数控制在1000-5000个区间,较传统GBLUP模型减少70%标记需求,同时保持预测精度在0.81-0.86的高位区间。这种"少而精"的标记策略对实际育种工作具有指导意义,特别是在高密度SNP芯片尚未普及的地区,可通过选择性标记低成本实现精准预测。研究建立的动态阈值筛选算法(STSA)已被集成到公开的Genomic Prediction 2.0软件包中,为后续甲壳类动物遗传改良提供工具支持。
研究还深入探讨了基因组预测模型的生物学适用性边界。通过构建不同规模(1000-5000个)的SNP标记集合,发现预测精度在4000个标记后趋于平台期(CV<5%),这为资源受限的养殖场提供了明确的标记使用指南。同时,研究首次揭示性别对GFBLUP模型的影响规律:雄性样本的预测精度较雌性平均提升8.7%,这可能与雄性个体在资源竞争中的生长优势相关,为性别导向育种策略提供了理论依据。
在遗传改良实践方面,研究团队开发了"双阶段筛选"技术流程。第一阶段通过全基因组关联分析快速定位候选区域(精度>0.7),第二阶段采用机器学习辅助的SNP功能注释系统(包含378个已知功能位点),将候选区域细分为关键调控区(CR)和非关键区域(NCR)。实验数据显示,CR区域的SNP标记贡献度达总遗传方差的62.3%,显著高于NCR区域的23.1%。这种精准的生物学分层为后续分子设计育种(MDSB)奠定了基础,特别是CR区域中的FANCI基因,其表达水平与体质量性状的相关系数达0.38(p=0.002)。
研究还揭示了环境与遗传的交互作用机制。通过构建包含环境因子的广义线性模型(GLM),发现温度波动对生长性状的调节效应存在显著的基因-环境互作(G×E)。其中,ACLY基因在温度高于28℃时表达量提升1.8倍,与CL性状的交互效应达p=0.003。这为环境适应性育种提供了新思路,建议在28℃以上环境进行定向选育,可有效提升生长性状的遗传增益。
在方法学创新方面,研究团队开发了智能权重分配算法(IWA)。该算法根据SNP在GWAS中的p值、功能注释强度(GO/KEGG富集度)和连锁不平衡程度(LD)三个维度动态调整权重系数。实验显示,IWA算法较传统加权方法(仅考虑p值)的预测精度提升9.2%,尤其在标记密度较低(<0.1 cM)区域表现更优。该算法已在广西海洋大学实验室的苗种筛选中推广应用,选育周期缩短40%。
该研究对甲壳类动物遗传改良具有范式意义。首先,建立包含390万SNP的全基因组参考面板,较现有40K芯片(Ye et al., 2025)覆盖度提升97.3%,为后续研究提供标准化数据基础。其次,开发的"预测-验证-优化"三阶段工作流程,将模型验证周期从传统6个月压缩至3个月,显著提升研究效率。特别值得关注的是,研究团队首次在甲壳类动物中验证了多效性遗传位点的存在,其中第3号染色体上的关键区域(CR3)同时调控体质量、肌肉量和抗病力三个核心性状,为多目标育种提供新靶点。
在产业化应用方面,研究团队与福建海洋水产研究所合作,建立了基于GFBLUP的分子育种平台。通过将预测模型整合到池塘养殖管理系统(PMS),实现实时生长监测和遗传改良决策支持。试点数据显示,应用该模型的养殖场平均单产提升22.3%,幼蟹存活率提高15.6个百分点,验证了基因组预测技术在实际生产中的可行性。
未来研究可沿着三个方向深化:其一,解析环境压力(如盐度、水温)与关键基因(ACLY、FANCI)的时空互作模式,建立动态基因组预测模型;其二,探索CR3区域的精细结构变异,开发靶向编辑技术(如TALEN)进行性状改良;其三,构建包含5000个核心SNP的便携式芯片,将实验室成果转化为田间实用技术。这些方向的研究将为实现甲壳类动物的全基因组选择(GS)提供理论支撑和技术路径。
本研究为全球甲壳类养殖业的遗传改良提供了重要参考。根据联合国粮农组织(FAO)2023年报告,全球每年消耗约120万吨甲壳类产品,其中中国占比达38%。通过将基因组预测模型应用于苗种选育,预计可使养殖周期缩短15-20%,饲料转化率提升10-15%,这对缓解气候变化背景下的海洋资源压力具有战略意义。研究团队正在与挪威养殖公司合作,将中华花蟹的GFBLUP模型应用于三文鱼生长性状的预测,探索不同物种间的遗传机制共通性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号