
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:基于计算机模拟的变异效应预测在精准植物育种中的前景与局限
【字体: 大 中 小 】 时间:2025年07月31日 来源:Theoretical and Applied Genetics 4.2
编辑推荐:
这篇综述系统阐述了AI序列模型(如语言模型LM和卷积神经网络CNN)在预测植物基因组变异效应(包括编码区和非编码区)中的应用潜力,重点对比了监督学习(如eQTL分析)与无监督学习(如进化保守性评分)方法的优劣。文章指出,尽管现代序列模型(如Enformer和AlphaFold2)通过整合基因组上下文克服了传统QTL定位和GERP评分的局限性,但其预测准确性仍受训练数据质量和验证实验的制约,尤其在调控序列建模和跨物种泛化方面存在挑战。
植物育种正从传统表型筛选转向精准育种(precision breeding),通过直接靶向因果变异实现性状改良。CRISPR等基因编辑技术的应用(如水稻OsSPL14基因编辑)已取得显著成效,但变异筛选仍依赖耗时费力的诱变筛选。计算机模拟(in silico)预测方法展现出替代潜力,其核心挑战在于准确预测变异对分子性状(如mRNA丰度)和宏观性状(如产量)的影响。
传统数量性状位点(QTL)定位通过线性回归关联基因型与表型,但存在分辨率低(>100 kb)、统计功效不足等局限。现代序列到功能模型(sequence-to-function models)采用统一框架预测变异效应:
传统方法(如GERP、SIFT)通过多序列比对(MSA)评估位点保守性,但受限于物种数量和功能周转(functional turnover)。新兴基因组语言模型(genomic LM)突破这一局限:
三类验证策略各有侧重:
当前核心矛盾在于:蛋白语言模型(如ESM)已实现跨物种应用,但基因组模型仍需解决调控语法学习、远端顺式元件(CRM)识别等难题。未来突破可能来自训练策略优化(如GPN-MSA引入比对信息)和作物特异性基准(Plant Genomic Benchmark)建立。
尽管尚未成熟,序列模型已展现三大育种价值:
生物通微信公众号
知名企业招聘