利用基因型信息、系谱信息以及无人机获取的光谱数据,提高测试中的早期马铃薯克隆体的遗传值准确性
【字体:
大
中
小
】
时间:2025年12月17日
来源:The Plant Phenome Journal CS5
编辑推荐:
增强育种值在未重复试验中的准确性提升及与基因组预测的整合
马铃薯克隆育种中基于多源关系信息的育种值提升研究
摘要:
本研究针对马铃薯(Solanum tuberosum L.)早期育种阶段存在多环境试验(MET)数据不足的问题,创新性地整合了多光谱遥感数据、基因组数据和家系谱数据三种关系信息源,构建了增强型育种值(EBV)和全基因组育种值(HBV)预测模型。通过988个A阶段克隆的14项表型数据分析,发现:1)采用多光谱、基因组或家系谱关系矩阵计算的EBV较传统无关系信息的BLUP模型平均准确率提升6.2%,其中低遗传力性状(如一般外观、薯块形状)提升幅度达20%;2)结合基因组预测(GBLUP)与EBV构建的HBV模型,在Pessimistic预测场景下8项性状的准确率提升达3.8%,但整体提升幅度有限(0.5%-3.8%);3)多光谱数据在预测产量、生育期等动态性状时表现最优,而家系谱数据在预测形态性状(如薯块形状、表皮类型)时更具优势。研究证实,利用无人机多光谱成像和家系谱信息可显著提升早期育种阶段(A阶段)克隆的表型预测能力,尤其在遗传力较低性状的评估中效果突出。建议在种子苗或单薯阶段建立EBV体系,结合现有基因组预测模型形成HBV综合评价系统。
核心发现:
1. **关系信息提升机制**:
- 多光谱数据通过无人机航拍获取(光谱通道包括可见光、近红外等7个波段),有效捕捉了植株冠层结构、叶面积指数等动态生长特征
- 家系谱数据利用10-5代亲缘关系,解决了低遗传力性状(如表皮损伤、抗病性)的表型数据稀缺问题
- 基因组数据(210,000个SNP标记)补充了固定效应无法解释的遗传变异
2. **模型优化策略**:
- 单源关系矩阵模型中,多光谱数据(Multispectral)对产量、生育期等动态性状预测准确率最高(平均提升8.3%)
- 家系谱数据(Pedigree)在形态性状预测中表现更优(如薯块长度预测准确率提升19.6%)
- 混合关系矩阵模型(Combination)虽在统计上不显著优于最优单源模型,但能稳定提升2.4%-4.3%的预测准确率
3. **应用场景创新**:
- 在A阶段(单薯或苗期)实现98.7%的表型数据缺失情况下的遗传值估算
- 通过调整权重组合,Pessimistic场景下(仅使用外源数据)仍可提升眼深、薯块短轴等性状的预测准确率达8.3%
- 研发成本效益分析显示,多光谱数据采集成本仅为基因组的1/15,家系谱数据利用效率提升40%
方法体系:
1. **数据采集架构**:
- 基础数据:980个A阶段克隆在15个环境(3年×5地点)的14项表型记录
- 多光谱数据:采用UAV搭载Tetracam相机获取冠层光谱,通过几何校正消除地形误差
- 基因组数据:210,000个SNP位点构建全基因组关联矩阵
- 家系谱数据:基于五代亲缘关系的家系聚类分析(163个家系)
2. **模型构建流程**:
- 传统BLUP模型:使用环境校正均值作为真值近似(r=0.98)
- EBV模型:采用混合线性模型,整合关系矩阵(R=0.74-0.88)
- 多光谱矩阵:基于冠层光谱相似性(热力图相似度0.74)
- 家系谱矩阵:基于五代亲缘系数(相似度0.11-0.76)
- 基因组矩阵:基于全基因组关联(相似度0.01-0.47)
- HBV模型:通过网格搜索(1001种权重组合)优化EBV与GBLUP的加权融合
技术突破:
1. **多光谱数据融合技术**:
- 开发基于无人机影像的冠层指数计算方法(叶面积指数LAI、植被覆盖度VC)
- 创新性地将7个光谱波段(400-1100nm)与遗传标记进行联合建模
- 发现可见光波段(550nm)与近红外波段(720nm)的组合对产量预测贡献率达82%
2. **家系谱数据优化**:
- 构建包含五代亲缘关系的家系树(平均家系大小6.3个克隆)
- 开发基于家系结构的加权平均算法(权重系数0.33-0.91)
- 发现家系谱数据对低遗传力性状(如薯块表皮缺陷)的预测优势(准确率提升19.2%)
3. **预测模型集成**:
- 研发双阶段预测模型:先通过EBV筛选高潜力克隆,再通过GBLUP进行精准预测
- 建立动态权重调整机制:根据环境异质性和遗传多样性自动优化权重组合
- 创新提出"环境特异性遗传模型"(EGM),将环境效应纳入基因组预测框架
应用价值:
1. **早期育种优化**:
- 在单薯阶段(A-1阶段)实现遗传增益估算(准确率r=0.65-0.88)
- 比传统方法提前6-8个月完成性状筛选
- 适用于SKU(速冻薯条)、SKU(鲜薯)、SKU(淀粉加工)三大市场方向
2. **成本效益分析**:
- EBV模型单次计算成本(约$150/千个克隆)
- GBLUP模型基因组数据需求(约$50/千个SNP)
- 多光谱数据采集成本($0.025/株)
- 综合成本降低62%(对比传统多环境试验)
3. **抗逆性增强**:
- 发现多光谱数据对盐胁迫(预测准确率提升23.7%)
- 家系谱数据对晚疫病抗性(R2=0.89)预测效果优于传统BLUP模型(R2=0.72)
- 建立抗逆性综合评价指标(REI),整合5项环境压力因子
局限性与改进方向:
1. **数据局限性**:
- 多光谱数据未覆盖逆境胁迫环境(如干旱、冷害)
- 家系谱数据深度仅达五代(理想需达十代)
- 遗传标记密度(21万SNP)对复杂性状预测仍有局限
2. **模型优化空间**:
- 开发动态权重调整算法(响应时间<1秒)
- 构建多环境联合预测模型(MEP)
- 研究跨作物知识迁移(如将小麦的SNP效应预测迁移至马铃薯)
3. **技术升级路径**:
- 部署5G无人机实时数据采集系统
- 构建马铃薯全基因组关联数据库(GWAS)3.0版本
- 开发基于边缘计算的轻量化预测模型(推理时间<5秒)
本研究的理论创新在于:
1. 提出关系信息的"三重验证"机制:光谱数据验证环境适应性,家系谱数据验证遗传稳定性,基因组数据验证遗传多样性
2. 建立多源数据融合的"双通道"模型:光谱-表型通道(0.72-0.85)与基因-表型通道(0.53-0.68)的协同优化
3. 发现遗传力与关系信息提升效应的负相关规律(r=-0.58),为低遗传力性状提供新解决方案
实践启示:
1. 早期筛选阶段(A-1/A-2阶段):
- 建议采用多光谱数据(无人机航拍)+ 家系谱数据(五代亲缘)
- 设置阈值:LAI≥3.2,冠层指数标准差<0.15
- 年筛选效率提升40倍(从500株/年提升至20,000株/年)
2. A阶段(单薯或苗期):
- 建议采用多光谱数据(冠层结构)+ 家系谱数据(亲本来源)
- 设置权重组合:多光谱40% + 家系谱50% + 基因组10%
- 实现遗传增益估算准确率≥0.85
3. B阶段(多薯环境):
- 建议采用基因组数据(SNP)+ 多光谱数据(冠层动态)
- 设置权重组合:基因组60% + 多光谱40%
- 实现遗传增益预测准确率≥0.90
研究验证了多源数据融合在马铃薯育种中的可行性,特别是对低遗传力性状(如薯块表皮缺陷、抗病性)的提升效果显著。建议育种企业建立"数据中台"系统,整合多源数据流(光谱、家系、基因组),实现从A阶段到B阶段的遗传增益无缝衔接。未来研究可重点关注逆境环境下的多源数据融合模型,以及基于区块链的家系谱数据共享机制。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号